前 家 《 工 ) 
第 1 章 典型 前 向 抽 经 半 络 0 《1 
1.1 感知 器 网 络 (41 
1.1.1 感知 器 的 网 络 丫 枸 必 其 芒 能 ee 《SS 

1.1.2 语 知 器 权 值 的 学 习 规 则 与 划 钴 pe 《五 ) 

1.2 有 和 月 适度 线性 元 件 pe 《111 
1.2.1 自 适 应 线性 神经 元 模型 和 娃 相 op 《111) 

1.2.2 克 - 互 学 习 规 则 有 其 网 络 的 训练 vevveeoooooovoooooorooovvoooceooooo 12) 

1.3 友 向 传播 阅 终 《13) 
1.3.1 瓜 向 传播 网 络 米 型 与 结 狗 ee 《13) 

1.3.2 HP 算 小 :ee (1S》 

1.3.3 BE 网 络 的 证 计 本 (17) 

1.3.4 BP 网 络 的 限制 与 不 嘴 划 pe 《191) 

第 2 间 网 络 训练 优化 算法 4 20) 
2.1 基于 标准 模 度 下 降 的 方 洲 ps 《211) 
2.1.1 附加 动量 浅 po 《211) 

2.1.2 自 适 应 学 习 速 举 pe (22 1 

2.1.3 性 BP 算 法 pe 《23) 

2.2 基于 数值 优化 方法 的 网 绕 训练 算法 pe {23) 
2.2.1 报 牛 纠 演 0 《241) 

2.2.2 共 斩 梯度 浅 《25) 

2.2.3 Levenberg 一 Marquardt 法 《了 5 

2.3 数值 实例 对 砂 pp {27) 
2.3.1 非 线性 函数 的 逼近 oo {27) 

2.3.2 通 近 非 线性 直流 电机 的 输入 [输出 特性 1 (29) 

2.4 小 铺 (31) 
第 3 章 BP 网 络 在 智能 系统 中 的 建 模 与 控制 pp (32) 
3.1 直接 正 了 向 赫 珊 建 音 《32》 

3.2 六 模 猎 建 况 9 《33》 

3.3 系统 中 的 控制 pp (35) 
3.3.1 监督 式 控 制 35) 

3.3.2 直接 递 控 利 pp 《33S》 

3.3.3 模型 泰 者 控制 pe 《36》 

工 


.3.4 肉 模 控制 【66 


第 4 章 反馈 网 终 《37) 
4.1 霍 普 菲 尔 德 网 络 模 玫 38》 
4.2 DIINN 的 学 习 规 出 ppp 38) 

4.2.1 海 布 学 习 才 央 38) 
4.2.2 正 衣 化 的 朱 植 讶 计 《40 
4,3 离散 型 反馈 网 络 的 稳定 点 与 稳定 域 seooovoucoveovoveoeooooooiiivieieoiosooseooeooioi { 呈 3) 
4.3.1 两 个 输入 神经 元 的 情况 pe (45) 
4.3.2 网 络 输入 神经 元 为 三 外 时 的 情况 他 新 (491) 
纯 .3 小 华 《5 1) 
十 ,村 连续 型 霍 普 菲尔德 网 络 1 (5S1) 
4.4.1 对 应 于 电子 更 路 的 况 络 结 补 pe (521 
4.4.2 才 普 菲 尔 掩 能 量 泗 数 及 其 稳定 性 分 煌 pe 《5 千 ) 
4.4.3 能 重 表 教 与 优化 计算 (57) 
4.5 用 CHNN 求解 TSP 问题 站 (5S8) 
4.5.1 网 络 设计 re 《59 ) 
d .5.2 对 终 态 时 系统 的 输出 向 曹 的 解释 ee 【61) 
4.5S.3 用 CHNIN 等 法 实现 TSP 的 问题 探 诗 【621) 
4.5.4 各 参数 的 影响 :pn 《6 和 ) 
4.5.5 小钱 【67) 

第 5 章 自 组 织 竞 和 邹 人 工 神 经 网 络 pp (68 ) 

.1 几 种 联想 学 习 规 则 pe (68) 
5.1.1 内 星 学 习 打 则 (69) 
S.1.2 外 星 学 习 规 则 pe (70) 
5.1.3 科 荷 丛 学 习 规 则 (7 了 11) 

5.2 自 组 织 竟 争 网 缁 pp 《371) 
5.2.1 网 络 持 料 《71) 
5.2,2 竞争 学 习 规 则 pp 《73》 
5.2.3 竞争 网 络 的 训 妖 过程 pp 《74) 

5 .3 科 倚 伦 自 组 织 映 射 网 络 ooooeooocooooooviecovcoooooocoocioodyeeooeoevyorvieootoreious (7 了 75) 
5.3,1 科 薪 伦 网 络 竟 括 亲 针 补 (77) 
5.3.2 网 络 的 训 钴 过程 pp (78 ) 
5.3.3 科 荷 伦 网 络 提 庭 用 pp 781) 

4 小 铺 《79) 

第 6 章 径 向 基 函 数 疯 绕 《80) 
6.1 径 向 基 贾 数 及 其 网 络 和 从 析 《80) 
王 .2 网 络 的 训练 与 设计 or (8S2) 
厂 .3 广义 径 向 基 网 络 oo 《83》 

[ 


6.4 数字 应 用 对 比 及 性 能 委 析 Ne 《84 1) 
后 .5 小 结 ysavuuvyyesssyouuscyseviirroivuuareuuseuivuacrvveusyieeiirusroouraiiuryeeoasyy， (85) 
第 7 章 模糊 理论 基础 站 生生 相生 村 《86) 
了 .1 引 ! 言 or (86) 
?.2 模糊 集合 及 其 求 属 函数 《88) 
7.2.1 模糊 集合 的 定 蚁 (88) 

了 7.22 模糊 集 侣 的 表示 方法 oo (89) 
7.2.3 模糊 集合 的 并 、、 补 运算 (90 1) 

7 了 7.2 插 宰 糊 集合 的 隶属 通 数 ov 《310 1) 

3.3 模糊 逻辑 pe 《2) 
了 .3 上 二 值 下 辑 、 多 值 还 辑 和 模糊 还 辑 ra 《号 2 1) 
7.3.2 模糊 远 辑 的 基本 运算 oo { 呈 21 
7.3.3 模糊 美 系 和 模糊 手 阵 pp 《94 ) 
7.34 模糊 语言 叹 其 算 子 evre errhreyasaovrrooseooeovreeiirvivoosoosoeeaeeouueeaaosoie 96) 
7.4 模糊 规则 与 模糊 推理 pe 《991) 
7.4.1 模糊 "如 果 一 那么 "规则 【 马 号 ) 

了 .4.2 模糊 这 罗 推理 eyeveeeeavryocevoooreceoovrrvooooooooeoocooioeiyeosvoooeoovoy va (ID0》 

和 草 8 章 模糊 控制 器 的 设计 方法 Le 《1L10) 
8.1 精确 与 模糊 控制 的 事例 RN (110) 
8.1.1 采用 精确 的 非 烧 类 求解 方法 (110) 
8.1.2 模糊 序 法 oo 《1L13) 
8.2 模糊 逻辑 控制 过 程 本 (114) 
8.3 输入 变量 和 输出 变量 的 确定 人 《11S) 
号 . 才 论 域 的 确定 seaeoeroooeocovycooseoovveoisvooovovoaieaiocososeisvvvoiyoooyoovoooeoosyvyyev 《116) 
8.S 确定 模糊 化 和 解 模 类 化 方法 pp 《113) 
8.5S,.1 模糊 化 方法 《118) 
8.52 和 解 措 糊 判 决 方法 os {I20) 
8.6 模糊 控制 规则 ppt 《122》 
8.7 模糊 有 到 辑 推理 pp (1231》 
和 .了 1 会 成 模 确 推理 法 vvoeeeeaasaaasassaroseieoiieoauteeeeooovoosssovv oo 《123) 
8.7.2 结论 是 线性 函 装 的 模糊 推理 方法 ppp 【132》 
8.7.3 量化 因子 及 比例 因子 揭 选 择 《133) 

第 9 章 运动 控制 市 的 摩 控 力 补 偿 及 其 建 模 技术 本 【1351 
中. 引 窗 0 (135》 
虽 .2 摩擦 学 及 实验 上 提出 的 非 线 性 摩擦 力 模型 站 《136) 
9.3 机 械 控 制 工程 上 采用 的 分 析 与 补 楼 滞 (137) 
9.4 运动 控制 pe (139) 
9.5 运动 控制 中 库 从 摩擦 力 的 结构 分 析 RN 《140) 
中 .站 基于 模型 的 摩 扩 力 前 向 补偿 器 的 设计 overoeouseiovsvooovocoseoosoecesoosooiooeeoevy 《143) 


re 一 一 -ev - -~--- -一 一 


9.7 线 性 模型 的 参数 辩 识 ssuierorriseucoooouieoooosrooeoriooooiocoirooosoooeeooyoovooeovovu 《144) 


9.37.1 基于 不 同 原理 的 辩 识 广 庄 ee 【144) 
59.7.2 MATILABS 中 系统 模型 认识 的 描述 疗 活 ee {147) 
9.7.3 库仑 摩擦 力 泰 教 的 共识 【148) 

9.8 运动 控制 中 的 机 电 控制 系统 Ne 《149) 
9.8.1 机 机 系 镶 ee {149) 
9.8.2 电子 学 找 术 -es 《149)》 
8.8.3 先进 的 计算 机 控 利和 《+307 
9.8.4 自 适 应 这 动 控 制度 用 的 例子 《151) 

中 .号 非 缆 性 直流 电机 仿真 模型 系统 的 建立 人 《153) 
吕 .9.1 被 榨 过 程 上 性 段 模 钼 的 参数 认识 本 《153) 
93.9.2 菲 线性 模型 的 建立 及 仿真 系统 的 实现 pe 《15S) 

香 10 章 模糊 控制 系统 的 应 用 sssssyvsssosveoyisivooooiyoovooossioiccoioooooosyysovoooovyovi。 {158) 
10. 1 速度 模糊 控制 器 的 设计 .pps (158) 
10.2 三 种 控制 器 的 设计 与 性 能 比较 《163) 
10.2.1 蒂 制 算法 的 播 速 (163) 
10.2.2 结果 的 对 比 aavrroouucuuvuvroseiuvoneecouyuawuucioasseavsieyeuraeaususoooousuuucu 《165) 

10.3 变 参 数 双 模 类 控 制 器 wearriroiovovviovoovioorocoooeeeoooeiooooeoeyiroteeooouvoeiooooaon {167) 
10.3.1 参数 的 证 定 oo 《167) 
10.3.2 迟 真 实验 验证 ppp 《169) 
10.3.3 小钱 eeooeeeoeo 《171) 

香 了 章 神经 网 络 的 应 用 esssss 《172) 
11.1 Bp 网 络 结构 .参数 及 训练 方法 的 设计 与 选择 ee (172) 
11.1.1 BP 网 络 的 刘 计 -Ne 《172) 
11.1.2 且 用 自 适 应 学 习 训 厌 与 国定 学 习 速 率 的 比较 (176》 
11.1.3 必 进 算法 的 性 能 比较 seuueyusousoeorruseeueuieeuuuuverhoyyreuuesrooeoosyrrenunnu 《177》 

11,2 神经 网 络 在 电机 非 线性 补偿 中 的 设计 与 实现 pp 《178) 
11.2.1 问题 的 提出 peeeeeeeeeeeeeeeoyesye 《178) 
11.2.2 得 服 电 机 神经 网 络 仿真 器 的 证 计 【1781 
11.2.3 和 神经 网 络 补 全 器 前 各 计 《180) 
11.2.4 神经 网 阁 控制 系统 ee (181) 
11.2.5 实验 测试 娃 果 eeoveoeoveocrovroucoeccoooooooeoorioceeacoeoiceeoieoosoieooseocoiveoei 《1827) 

1 和 小 钳 《183) 

第 12 章 模糊 神经 网 络 sosoosssosovyousvyeoooovoioniocirrooooooyoreoeoooirrrroryovyocyiyesriusvoon {184) 
12.1 避 吝 99eeeee 【184) 
12.2 模糊 系统 的 关系 式 veuvoyoyieveyocoeroceoooooooocoooroooooioooorooooooooooeyoiinooe ye 《184) 
12.3 用 神经 网 络 直接 实现 的 模糊 系统 -oo 【186) 
12. 攻 Sugeno 模糊 推理 法 sosoyyvooeyveaeeseeuauaieeueewaieieceeiwewiueueyaauawuawaueseeettyywtt {187) 





I2.5 色 样 条 模糊 神经 阿 络 sureurrusrrosrraaieasuvuuuiieuusrutervyaoouuieauuvroivrooooo ia 《188) 


12.5.1 吕 样 条 函 数 及 其 网 络 pe 《188) 

12.5.2 也 样 条 横 寡 神经 网 络 控制 器 前 设计 《191) 

和 .6 径 向 基 图 数 神 经 阿 猴 pp 《192) 

12 .7 小 结 oseoyyanisyriveyiieyavyyoreeoieivoiiooyeeoevuoyyivhioeiyrorieyocooeroiyeuseiaotoits 《195) 

第 13 章 模糊 神经 系统 的 庶 用 .Ne 【1961 
13.1 基于 ANFIS 的 非 线 性 电机 系统 的 建 模 pp 《106) 
13.1.1 ANFIS 的 半 构 po 《196》 

13.1.2 混合 学 习 算 汪 ee 《198》 

13.1.3 非 线 性 电机 系 往 建 模 ee 《198) 

13,1.4 基于 ANEFIS 的 建 煤 和 peer 【199》 

13.41.5 将 识 措 型 的 验证 pe 《200) 

13.1 6 小 钴 (2021 

13.2 用 自 组 织 竟 争 网 络 优化 模糊 神经 网 络 的 结构 pp (202) 
13.2.1 直 组 织 亮 争 神 经 网 络 pp (203) 

13.2.2 具有 最 佳 结构 与 参数 的 模糊 神经 网 络 裕 制 器 的 证 计 《204) 

13.2.3 小 结 《207) 

第 14 章 遗传 算法 Ne (208) 
14.1 过 传 算法 的 基本 特 上 pp 《209) 

14.2 过 传 算法 的 基本 操作 .pp 210) 

14.3 壹 传 算法 的 设计 步 又 .pe (212) 

14.4 传 算法 的 实 夺 pe 《213) 

14.5 小 钳 《214) 

第 1S 章 遗传 算法 的 度 用 《215) 
15.1 采用 和 遗传 算法 提高 神经 网 络 模型 辩 识 的 精度 ee (215) 
15.1.1 引 训 et 《21S)》 

15.1.2 改进 前 遗传 算 清 Ne {216》 

1$.1.3 实例 验证 pe 《217》 

TI5.1.4 小钱 2189) 

15.2 模 贿 神经 网 络 和 遗传 算法 相 结合 的 控制 策 上 es (218) 
15.2.1 中 高 (218) 

15,.2.2 优化 控制 系统 揭 钻 枸 ppp (219) 

15.2.3 优化 仿真 结果 揭 财 比 和 他 新 (2221 

13.2.4 小钱 er (223) 

第 16 章 寞 拟 退 火 算 法 及 其 应 用 生生 的 开 【224) 
16.1 Metropolis 准则 和 模拟 退火 算 淡 pe 《224》 

16.2 模拟 退火 算法 的 设计 步骤 Re (225) 

16,3 应 用 模拟 退火 算法 求解 TSP 问题 Ne 《226) 

YY 


16.3.1 TSP 问题 的 求解 步骤 pe (227》 


16.3.2 冷 都 进度 表 的 选取 pep {228) 
16.3.3 求解 TSE 问题 的 程序 实现 ， 和 pe (230) 
16.3.4 模拟 退火 算法 的 性 能 对 比 Woosveasossiyotiiosasiiesasiasoayoyanooooyiy (232) 
16.4 模拟 退火 算法 的 疏 吉 pe 《235) 


参考 文献 


第 1 章 典型 前 向 神经 网 络 


人 工 神 经 网 络 ( Artificial Neural Network， 简称 ANN) 是 山大 量 简单 的 处 理 单元 组 成 
的 非 线性 、 自 适应 、 自 组 织 系统 ， 它 是 在 现代 神经 科学 研究 成 果 的 基础 上 ， 试 图 通过 模拟 
人 类 神经 系统 对 信息 进行 加 工 、 记 忆 和 处 理 的 方式 ， 设 让 出 的 -种 具有 人 脑 风 格 的 信息 处 
理 系 统 。 人 了 脑 是 人 迄今 为 沾 我 们 所 知道 的 最 完善 最 复杂 的 智能 系统 , 它 兵 有 域 知识 判 、 党 习 、 
联想 、 记 忆 、 推 理 等 智能 ， 人 类 智能 的 产 牛 和 发 展 经 历 了 漫长 的 进化 过 程 ， 而 人 类 对 知 能 
处 理 的 新 方法 的 认识 主要 来 自 神 经 科学 。 虽 然 人 类 对 自身 脑 神 经 系统 的 认识 还 非常 有 限 ， 
但 已 设计 出 像 人 工 神 经 网 路 这 样 县 有 相 汉 实用 
价值 和 较 商 智能 水 平 的 信息 处 理 系统 。 

按 其 信息 流 回 米 分 类 ， 大 王 神 经 网 络 可 以 
被 分 成 前 商 网 络 和 反馈 网 络 。 本 举 将 对 典型 前 
向 网 络 的 结构 、 功 能 及 其 性 能 予以 介绍 ， 其 中 
包括 感知 有 刁 、 自 适应 线性 元 件 和 反 向 传播 网 
络 。 

人 工 神经 网 络 是 通过 计算 机 软件 或 电子 线 
路 俩 件 构成 的 。 它 是 由 最 简单 的 人 工 神 经 元 并 
联 ， 或 者 再 加 上 串联 组 成 。 人 们 道 常 用 图 形 来 图 1. 1 单个 神经 元 模型 结构 
表示 网 络 系 统 的 输入 到 输出 的 转化 关系 。 单个 神经 元 可 以 表示 为 如 图 1.1 所 示 的 模型 结 术 ， 
其 中 ， 神 络 元 输入 和 所 量 用 犯 阵 形式 可 以 表示 为 : 



































王 = [Pi pa …Bpr1， 权 和 托 阵 克 = [1 2 
单个 神经 元 输出 和 与 笨 入 已 之 间 的 对 应 关系 可 表示 为 : 


4 7 室 呈 亲 +0 一 凡 We 二 《1.1》 
盖 
其 上 中， 习 称 为 浆 值 ， 或 偏差 ， 六 代表 某 种 激活 函数 关系 式 。 

可 以 说 单个 神经 元 就 是 一 个 多 输入 / 单 答 出 的 系统 。 两 个 或 更 多 的 单 神经 元 相 并 联 则 
梅 成 单 层 神经 网 络 ， 如 网 1.2 所 示 。 

两 个 及 其 以 上 单 层 神经 网 络 相 级 联 则 构成 多 层 神 经 网 络 ， 如 图 13 所 示 。 

出 于 在 网 络 输入 /输出 关系 式 中 对 所 使 用 的 变量 采用 了 和 矩阵 形式 米 表 达 ， 所 以 对 于 单 
层 多 输出 神经 网 络 ， 其 表达 形式 与 单个 神经 元 时 完全 相同 。 如 图 1.2 所 表示 的 神经 元 售 数 
为 了 的 单 层 神经 网 络 的 输入 /输出 关系 式 可 写 为 ; 

| 三 中 (4svxr 亲 嫩 > 十 召 :x1 (1.27 

一 个 多 层 神 经 阅 络 的 输入 /输出 关系 ， 林 以 以 单 层 神 经 网 络 的 关系 进行 递 推 ， 将 前 一 

层 的 输出 作为 后 一 户 的 输入 ， 并 采用 与 单 层 的 神经 网 络 同样 的 书写 方式 即 可 方便 地 写 出 。 








如 网 1.3 所 示 的 一 个 共有 3 层 神经 网 络 的 输入 /输出 关系 可 写 为 : 
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图 1. 2 单 层 神经 元 网 络 模型 结构 图 
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《a) 三 晨 的 神经 巾 络 结构 图 
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图 1.3 多 层 神经 网 络 
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43 = F3( 全 3# 42 二 五 3) 03， 
= 下 3 后 3* 严 2 机 2* FICWLI*+P+BD+B2|+B31 


对 于 这 种 标准 全 联接 的 多 层 神 经 网 络 ， 更 一 般 的 简便 作 图 是 仅 画 出 输入 节点 和 一 组 隐 


含 层 节点 外 加 输出 节点 及 其 连 线 来 示意 表示 ， 如 图 1.4 所 示 。 几 中 只 标 出 输入 、 输 出 利 权 
矢量 ， 完 全 省 去 激活 函数 的 符号 。 完 整 的 网 络 结构 则 是 通过 有 具体 的 文字 描述 来 实现 的 ， 如 ; 
网 络 具 有 一 个 隐 含 层 ， 隐 仿 层 中 具有 5 个 神经 元 并 采用 8 型 激活 函数 ， 答 出 层 采 用 线性 巩 


妃 


此 
明 机 
图 1. 4 神经 网 络 结构 示意 图 
数 ， 或 者 更 简明 的 可 采用 “网 络 采用 2-5-1 结构 ”来 描述 ， 其 中 ，2 表示 和 输入 节点 数 : 5 
表示 风 含 层 节点 数 ; 1 为 输出 节点 数 。 如 果 不 对 激活 函数 作 进 一 步 的 说 明 ， 旭 意味 着 隐 合 
层 采 用 S$ 型 函数 ， 而 输出 层 采 用 线性 函数 。 

特别 值得 强调 的 是 ， 在 设计 多 层 网 络 时 ， 隐 含 层 的 激活 网 络 应 采用 非 线性 的 ， 否 则 多 
层 网 络 的 计算 能 力 并 不 比 单 层 网 络 更 强 。 因 为 在 采用 线性 激活 函数 的 情况 下 ， 由 于 线性 激 
活 函 数 的 输出 就 等 于 网 络 的 加 权 输 入 和 ， 即 4= 仇 * 已 + 站 ， 如 果 将 偏差 作为 一 组 权 值 归 
为 太 中 统一 处 理 ， 两 层 网 络 的 输出 42 则 可 以 写 为 ， 

42= 严 2(Y2+AT) 
= 到 2 半 严 HOW1*+ 疡 ) 
= 卫 2* 厚 1*# 已 
= 卫 汪 亚 

其 中 ，F = 到 = 下 为 线性 激活 函数 。 上 式 表明 两 层 线 性 网 络 的 输出 计算 等 效 于 具 洗 
权 矢 量 为 古 = 风 2* 你 1 的 单 层 线性 网 络 的 输出 。 

由 此 可 上 见 ， 人 工 神 经 网 络 工作 时 ， 所 表现 出 的 就 是 一 种 计算 ， 利 用 人 工 视 经 网 络 求解 
问题 时 所 利用 的 也 正 是 网 络 输入 到 网 络 输出 的 某 种 关系 式 。 与 其 他 求 输入 /输出 关系 式 方 
法 不 同 的 是 ， 神 经 网 络 的 输入 /输出 关系 式 是 根据 网 络 结构 写 出 的 ， 并 且 网 络 权 值 的 设计 
往往 是 通过 训练 而 不 是 根据 某 种 性 能 指标 计算 出 来 的 。 所 以 ， 应 用 神经 网 络 解决 实际 问题 
的 关键 在 于 设计 网 络 ， 而 网 络 的 设计 主要 包括 两 方面 的 内 容 ， 一 是 网 络 结构 ， 另 一 个 是 网 
络 权 值 的 确定 。 第 一 个 方面 涉及 到 对 不 同 网 络 结 梅 所 具有 的 功能 及 其 本 质 的 认识 ， 第 二 个 
方面 涉及 到 对 不 同 网 络 权 和 值 训练 所 用 的 学 习 规 则 的 掌握 。 所 以 无 论 是 作为 学 习 、 应 用 ， 还 
是 作为 更 深层 次 的 理论 研究 ， 这 两 步 都 是 最 重要 的 。 正 因为 如 此 ， 人 们 对 人 工 神经 网 络 进 
行 分 类 时 ， 也 是 有 两 种 方法 ， 一 种 是 根据 网 络 结 禄 分 为 前 向 网 络 和 反复 网 络 两 大 类 ， 另 一 
种 是 按 训 练 权 值 方法 分 为 监督 式 〈 或 有 教师 ) 网 络 和 无 赣 督 式 〈 无 教师 ) 网 络 两 种 。 

在 神经 疝 络 的 输入 与 输出 之 间 所 存在 的 关系 函数 ， 类 似 于 控制 系统 中 的 转移 函数 ， 称 
为 激活 函数 ， 由 它 决定 网 络 的 线性 和 非 线性 ， 它 是 网 络 特性 及 功能 的 关键 所 在 。 在 控制 系 
统 中 ， 一 般 对 控制 器 的 设计 是 根据 某 个 性 能 指 称 来 设计 控制 器 的 结构 或 参数 ， 与 此 不 同 ， 
在 神经 网 络 信息 处 理 系统 中 ， 设 计 者 是 根据 期 望 网 络 完成 的 目标 〈 或 任务 ) 以 及 某 种 调整 
网 络 权 什 所 采用 的 学 习 规 则 来 确定 网 络 的 结构 与 权 值 。 由 于 网 络 的 权 值 -一 般 不 是 计 -算出 而 
是 训练 出 的 ， 所 以 利用 神经 网 络 解决 问题 时 ， 对 于 采用 监督 式 学 习 的 网 络 ， 网 络 的 设计 要 
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经 过 两 个 阶段 ， 首 先是 网 络 校 值 的 训练 〈《 旭 学 习 并 修正 ) 阶段 ， 然 后 才 是 网 络 的 运行 工作 
阶段 。 而 对 于 采用 非 监 督 式 学 习 的 网 络 ， 则 将 网 络 权 值 的 训练 与 工作 合 :为 一 ， 即 在 网络 
工作 的 问 时 ， 调 整 网 络 的 极 值 ， 所 以 神经 网 络 具 有 自学 习 、 自 适应 的 特性 。 

一 般 而 音 ， 由 人 工 神经 网 络 组 成 的 信息 处 理 系 统 所 有 具有 的 特性 为 : 

1) 非 线性 

神经 网 络 对 非 线性 控制 领域 问题 的 解决 带 来 了 希望 ， 这 主要 是 出 神经 网 络 理论 上 能 够 
任意 通 近 非 线 性 连续 有 理 函 数 的 能 力 所 次 定 的 。 神 经 网 络 还 能 够 比 其 他 通 近 方法 得 到 更 加 
易 得 的 异型 。 

2 1) 并 行 分 布 处 理 

神经 网 络 具 有 一 个 使 其 自身 进行 并 行 实施 的 高 度 并 行 结构 ， 如 此 的 实现 结构 使 其 能 够 
达到 比 常 闪 方 法 所 获得 结果 具有 更 高 的 容错 性 。 另 外 ， 虽 然 一 个 神经 网 络 中 的 基本 处 理 单 
元 是 非常 简单 的 结构 ， 然 而 将 其 进行 并 行 实现 的 连接 ， 则 产生 了 极 快 的 整体 处 理 效果 。 

3) 硬件 实现 

神经 网络 不 仅 能 够 进行 并 行 处 理 ， 还 可 以 通过 引入 大 规模 集成 电路 将 其 进行 硬件 实 
更， 这 将 带 来 附加 的 和 速度， 并且 可 以 增加 应 用 网 络 的 规模 。 

4)》 学 习 与 自 适 应 

神经 网 络 古 通过 采用 被 研究 系统 的 数据 记录 进行 训练 而 获得 的 。 对 于 一 个 训练 好 的 网 
络 ， 对 其 输入 训练 中 未 知 的 数据 时 ， 具 有 很 好 的 渗 化 能 力 。 

5) 数据 融合 

神经 网 络 能 够 同时 朱 作 定量 和 定性 的 数据 ， 这 一 特性 使 神经 网 络 可 以 处 理 处 在 传统 的 
系统 工程 《定量 数据 ) 与 人 工 智能 领域 的 处 理 技术 (符号 数据 ) 之 间 的 问题 。 

6) 多 变 时 系统 

神经 网 络 本 身 跌 是 一 个 多 输入 /多 输出 系统 ， 这 个 系统 为 解决 复杂 的 多 变量 系统 的 建 
模 各 控制 等 问题 开辟 了 一 条 新 的 途径 。 

















1.1 感知 器 网 络 


我 们 已 经 知道 ， 人工 神经 网 络 起 在 人 类 对 其 大 脑 神经 网 络 认识 理解 的 基础 上 人 工 构 造 
的 能 够 实现 某 种 功能 的 神经 网 络 。 它 大 理论 化 的 人 脑 神经 网 络 的 数学 模型 ， 串 基于 模仿 大 
脑 神经 网 络 结构 和 功能 而 建立 的 一 种 信息 处 理 系统 。 人 工 神 经 网 络 吸 取 了 生物 神经 网 络 的 
许多 优点 ， 它 具有 高 度 的 并 行 性 、 非 线性 的 全 局 作用 ， 以 及 良好 的 容错 性 与 联想 记忆 功能 ， 
工 且 只 有 很 强 的 身 适应 、 自 学 习 能 力 。 随 着 人 工 神经 网 络 技术 的 不 断 发 展 ， 其 应 用 领域 也 
在 不 断 拓 展 ， 主 要 应 用 于 模式 信息 处 理 、 函 数 遵 近 和 模式 识别 ， 以 及 联想 记忆 、 最 优化 问 
题 计算 和 自 适 应 控制 等 方面 。 在 前 向 网络 中 ， 最 典型 的 网 络 是 反 向 传播 网 络 ， 不 过 ， 它 也 























大 在 最 早 的 人 工 神经 网 络 一 一 凸 知 器 基础 上 发 展 起 来 的 ， 并 且 在 线性 分 类 问题 中 ， 域 知 器 
仍然 发 挥 着 币 要 的 作用 。 
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1.1.1 感知 器 的 网 络 结构 及 其 功能 


最 早 用 数学 模型 对 神经 系统 中 的 神经 元 进行 理论 建 模 的 二 美国 心理 学 家 记 目 洛克 {W. 
Mecallocm 和 数学 家 皮 蒋 《W. Pitts)。 他 们 于 1943 年 在 分 析 和 研究 了 人 脑 细胞 神经 元 后 用 
电路 构成 了 简单 的 神经 网 络 数学 模型 (简称 MP 模型 )。 感 知 器 【Perceptron) 是 山 芙 国 计 
算 机 科学 家 多 森 布 拉 特 〔F Rosenblatt) 于 1957 年 提出 的 。 感 氏 器 是 在 MP 模型 的 基础 上 ， 
加 上 学 习 功 能 ， 使 其 权 值 可 以 连续 调节 的 产物 。 它 是 一 个 具有 一 层 神 经 元 、 采 用 阅 值 激活 
函数 的 前 向 网 络 。 

感知 器 的 网 络 结构 是 由 单 层 > 个 感知 神经 匹 ， 通 过 一 组 权 值 [wj (= 古 2…5; 了 =， 
2，.…， 门 与 了 个 输入 相连 组 成 。 对 于 具有 输入 矢量 媒 xy 和 目标 矢量 了 xs 的 感知 器 网 络 的 简 
化 结构 如 图 1.5 所 示 。 阁 人 导 激活 函数 如 图 1.6 所 示 。 











于 
: 各 
3 
图 1.5 嫩 知 器 简化 纤 构 者 图 1.6 阅 值 激活 函数 
感知 器 输入 /输出 函 煞 关系 式 为 : 
1 并 W*PdB>0 
么 = 《1.3) 
0 立 W*P+D<0 


由 上 式 可 知 ， 遂 过 对 网 络 权 值 的 训练 ， 可 以 使 感知 器 对 一 组 输入 矢量 的 响应 达到 元 素 
为 0 或 1 的 目标 和 输出， 从 而 实现 对 输入 矢量 分 类 的 目的 。 

感知 器 的 这 一 功能 可 以 通过 在 输入 矢量 空间 里 的 作 图 来 如 以 解释 。 以 输入 矢量 > = 2 
为 例 ， 对 于 选 定 的 枢 值 w 、wz 和 pp， 可 以 在 以 输入 矢量 志和 户 分 别 作为 横 、 纵 举 标的 输 
六 平面 内 画 出 WsP + 五 = 0， 即 wpPi+H2pi+ 瑟 =0 的 轨迹 ， 它 是 一 条 直线 ， 此 直线 上 的 以 
及 线 以 上 部 分 的 所 有 户 、 户 值 均 使 wpi+wapo+p > 和 这些 点 若 通过 出 w 、wz 和 记 构 成 的 
壤 知 器 则 使 其 输出 为 1， 该 直线 以 下 部 分 的 点 则 使 感知 器 的 输出 为 0， 如 图 1.7 所 示 。 

所 以 当 采 用 域 币 器 对 不 同 的 输入 矢量 进行 期 望 输出 为 0 或 工 的 分 类 时 ， 其 问题 则 转化 
为 : 对 于 已 知 和 输入 矢量 所 处 输入 平面 的 不 同 点 的 位 置 ， 设 计 同 知 器 的 权 值 外 和 上 将 由 
WP + 呈 =0 的 音 线 放置 在 适当 的 位 置 上 使 输入 矢量 按期 望 输出 值 进 行 上 下 分 类 。 推 而 广 
之 ， 闪 值 函 煞 通过 将 输入 和 失 量 的 ”> 维 空 间 分 成 若干 区 域 而 使 感知 器 具有 将 输入 矢量 分 类 的 
能 力 。 对 于 不 同 的 输入 神经 元 r 和 输出 神经 元 * 组 成 的 感知 器 ， 当 采用 输入 和 失 量 空间 的 作 

和 




















图 法 米 解 释 网 络 功能 时 ， 其 分 类 的 一 般 情 况 可 以 总 结 为 : 








图 1.7 感知 器 的 疼 形 解释 

吕 治 网 络 输入 为 单个 人 节点， 输出 也 为 单个 神经 元 ， 即 了 = 1，s = 1 时， 感知 器 是 以 点 
作为 输入 和 失 量 轴线 上 的 分 割 点 : 

鸭 当 网 络 笨 入 为 两 个 节点 ， 即 了 = 2 时 ， 感 知 器 是 以 线 对 输入 矢量 平面 进行 分 类 ; 其 
中 : 当 > = 1， 分 类 线 为 一 具 :; 9 = 2， 分 类 线 为 两 条 ， 售 此 类 推 。 答 出 神经 元 个 数 * 决定 
分 类 的 直线 数 ， 可 分 成 的 种 类 数 为 23; 

民 当 网 络 输 入 为 三 个 节点 ， 即 ” = 3 时， 感知 器 是 以 平 而 来 分 制 输入 矢量 空间 ， 而 且 
甩 来 进行 空间 分 朝 的 平面 个 数 等 于 输出 神经 元 个 数 *。 


1.1.2 感知 器 权 值 的 学 习 规 则 与 训练 


学 习 规 则 是 用 来 计算 新 的 权 亿 和 手 阵 凡 及 新 的 偏差 吾 的 算法 。 感 知 器 利用 其 学 习 规 则 
来 调整 网 络 的 权 值 ， 以 便 使 网 络 对 输入 矢量 的 响应 达到 数值 为 0 或 1 的 目标 输出 ， 

对 于 输入 矢量 P、 输 出 失 量 4、 目 标 矢 量 为 了 的 感知 器 网 络 ， 感 利器 的 学 习 规 则 是 根 
据 以 下 竹 由 矢量 可 能 出 项 的 三 种 情况 来 进行 参数 调整 的 。 

GO 如 果 第 个 神经 元 的 输出 是 正确 的 , 即 有 名 = 如 那么 与 第 i 个 神经 元 联防 的 权 值 w 
和 偏差 疡 保持 不 变 ; 

包 训 果 第 计 个 神经 元 的 输出 是 0 ， 但 期 望 输出 为 1 ， 即 有 ww =0， 而 # =1， 此 时 权 值 
修正 算法 为 : 新 的 权 值 wy 为 旧 的 权 值 w 加 上 输入 矢量 户 ， 类 似 地 ， 新 的 偏差 吕 为 归 偏 差 
饭 加 上 它 的 输入 1 ; 

@@ 如 果 第 诫 个 神经 元 的 输出 为 1 ， 介 期望 输出 为 0 ， 即 有 w =0， 而 上 =1， 此 时 权 值 
修正 算法 为 : 新 的 权 值 w; 等 于 旧 的 权 值 w; 减 去 和 输入 矢量 pi; 类 似 地 ， 新 的 恼 差 上 为 旧 偏 
壮志 减 去 1 。 

由 上 面 分 析 可 以 看 出 ， 感 知 器 学 习 规则 的 实质 为 : 权 值 的 变化 量 等 于 正 负 输 入 矢量 。 
有 具体 算法 总 结 如 下 ; 

对 于 所 有 的 ;和 六 计 1.2 …,5，，7= 1 2 …,r， 感 知 器 修正 权 值 公式 为 ， 

An 人 一 Qi)X 忆 ) 


Ab = 伯 一 qi)xl 9) 


用 矢量 和 抱 阵 来 表示 为 : 

本 = 风 +FP- 
吕 王 及 十 五 

此 处 ， 五 为 误差 拓 量 ， 有 天 = 了 -4 。 

感知 回 的 学 习 规 则 属于 梯度 下 降 法 。 忆 被 证 明 ， 如 果 解 存在 ， 则 算法 在 有 限 次 的 循环 
迁 代 万 可 以 收 笋 到 正确 的 目标 矢量 。 

要 使 前 向 神经 网 络 模型 实 更 其 种 功能 ， 儿 须 对 它 进行 训练 , 让 它 逐 步 学 会 要 做 的 事情 ， 
并 把 所 学 到 的 秃 识 记忆 在 网 络 的 权 介 中。 人工 神 经 网 络 权 仁 的 确定 外 是 通过 计算 ， 而 站 通 
过 网 络 的 自身 训练 米 完成 的 。 这 也 是 人 工 神 经 网 络 在 解决 问题 的 方式 上 与 其 他 方法 的 最 大 
不 同 点 。 借 助 于 计 竺 机 的 帮助 ， 几 百 次 慧 至 上 千 次 的 网 络 权 值 的 训练 与 调整 过 程 能 够 在 很 
短 的 时 间 内 究 成 。 

感知 器 的 训练 过 程 如 下 : 

在 笨 入 矢 晨 忆 的 作用 下 ， 计 算 网 络 的 实际 输出 4， 并 与 相 诬 的 日 标 矢 量 了 进行 比较 ， 
检查 4 总 否 等 于 7， 然后 用 比较 后 的 误 益 五， 根据 学 习 规 则 进行 权 值 和 偏差 的 调整 ， 重 新 
计算 网 络 在 新 权 值 作用 下 的 输入 ， 于 复权 值 调 整 过 程 ， 碍 到 网 络 的 输出 4 等 于 日 标 矢 量子 
或 训练 次 数 达 到 事先 设置 的 最 大 值 时 训练 结束 。 

若 网 络 训练 成 功 ， 那 么 训练 后 的 网 络 在 网 络 权 值 的 作用 下 ， 对 于 被 训练 的 每 一 组 输入 
和 失 旦 都 能 铝 产 生 -- 组 对 应 的 期 望 输出 ， 状 在 设置 的 最 大 训练 次 数 内 ， 网 络 未 能 够 完成 在 给 
定 的 输入 乐 量 忆 的 作用 下 ， 使 4 = 了 的 目标 ， 则 可 以 通过 改 用 薪 的 初始 权 值 与 偏差 ， 并 采 
用 更 长 训练 次 数 进行 训练 ， 或 分 析 一 下 所 要 解决 的 问题 是 否 属于 那 种 由 于 感知 器 本 身 的 想 
制 而 无 法 解决 的 一 类 。 

感知 器 设计 训练 的 步骤 可 总 结 如 下 : 

全 对 于 所 归 解 决 的 问题 ， 傅 定 输入 矢量 已， 日 标 矢 量 7 了， 并 由 丝 确 定 各 和 失 量 的 维 数 以 
及 依 定 网 络 结构 大 小 的 神经 元 数目 : 六 ?和 9 

多 参数 初始 化 : ) 赋 给 权 矢 量 六 在 (- 的 随机 非 零 初始 值 ; 

b) 给 出 最 大 训练 循环 次 煞 ， 

电网 络 表达 式 : 根据 输入 矢量 以 及 最 新 权 矢 量 W， 计 算 网 络 输出 矢量 4; 

也 检查 : 检 洁 输出 秋 量 4 与 日 标 失 量 了 足 否 相同 ， 如 果 是 ， 或 已 达 最 大 循环 次 数 ， 
训练 结束 ， 和 否则 转 入 回 : 

雹 学 习 : 根据 (1.7) 式 感知 器 的 学 习 规 则 调整 权 失 量 ， 并 返回 全 。 

下 面 给 出 倒 题 来 进一步 了 解 感知 器 解决 问题 的 方式 ， 掌 握 设 计 训 练 感知 器 的 过 程 。 

例 1.1 考虑 一 个 简单 的 分 类 问题 。 

设计 一 个 感知 器 , 将 二 维 的 四 组 输入 矢量 分 成 两 类 。 

输入 失 量 为 : P=[-0.5 -05 03 0 

-05 05 -05 下 


《1.7) 











日 标 矢 量 为 : T=[10 10 0 0)]， 
解 : 道 过 前 而 对 感知 器 赂 解 的 分 析 可 知 ， 感 知 器 对 输入 矢量 的 分 类 实质 是 在 答 入 和 
量 宗 间 用 WsP+8=0 的 线性 表达 式 对 其 进行 分 割 而 达到 分 类 的 日 的 。 根 据 这 个 原理 ， 对 
此 倒 中 一 维 四 组 输入 矢量 的 分 类 问题 ， 训 以 用 下 述 不 等 式 组 米 等 价 表示 出 ; 
了 





一 0.3wi 一 0.3w: + 户 20 【〔 代 | =] 成 立 ) 
一 0.3Wi; 十 和 .3Wa。 十 声 之 人 【使 1 = 1 成立 ) 
人 .3 一 站 SSW2 十 疡 < 站 【使 ?3 = 昌 成 立 ) 
Woa 十 疡 <0 【使 14 三 0 成 立 ) 


实际 上 可 以 用 代数 求解 法 来 求 出 上 面 不 等 式 中 的 参数 ww、w: 和 B。 经 过 迁 代 和 约 简 ， 
可 得 色 解 的 范围 为 ; 
TH 坪 必 
0.8W| < Wa 芭 一 Wi 
WA73<E< 一 Wl 
百 二 一 Wo 
一 组 可 能 解 为 : 
5 三 一 ] 
WA 一 站 
五 = -0.1 


而 当 采 用 感知 器 神经 网 络 来 对 此 题 进 行 求解 时 ， 意 味 着 采用 具有 闪 值 激活 函数 的 神经 
网 络 ， 接 隔 问 题 的 要 求 设计 网 络 的 模型 结构 ， 通 过 训练 网 络 权 值 克 = [wy wa 和 有 ， 并 根 
据 学 习 算 法 和 训练 过 程 进行 程序 编程 ， 然 后 运行 程序 ， 让 网 络 自行 训练 其 权 和 泉 量 ， 直 至 达 
到 不 等 式 组 的 要 求 。 

鉴 本 输入 和 输 册 目标 矢量 已 由 问题 本 身 确定 ， 所 以 所 怖 实现 其 分 类 功能 的 感知 器 网 络 
结构 的 输入 节点 ”， 以 及 输出 节点 数 * 已 被 问题 所 确定 而 不 能 任意 设置 。 

根据 题 意 ， 网 络 结构 图 如 图 1.8 所 示 。 

巾 此 可 见 ， 对 于 单 层 网 络 ， 网 络 的 输入 神经 元 数 r 和 输出 神经 元 数 * 分 别 由 输入 矢量 
已 和 目标 矢量 了 唯一 傅 定 。 网 络 的 权 和 矩阵 的 维 数 为 : W，B8 4 ， 权 值 总 数 为 *xr 个 ， 偏 
差 个 数 为 了 个 。 

苷 傅 定 了 网 络 结构 ， 设 置 了 最 天 循环 次 数 并 赋予 权 值 初始 值 后 ， 设 计 者 便 厅 方便 地 利 
用 适当 软件 ， 根 据 题 意 以 及 感知 器 的 学 习 、 训 练 过 程 来 编写 程序 ， 并 通过 计算 机 对 权 值 的 
反复 训练 与 调整 ， 最 终 求 得 网 络 的 结构 参数 。 





已 ， 7 
站 
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了 
-1234 
图 1.8 网 络 结构 图 





十 面 的 结果 似乎 表明 只 训 增 加 输出 神经 元 数 *， 就 能 够 解决 任意 数目 的 分 类 问题 车 
实 上 ， 对 于 输出 为 0 或 1 的 感知 器 ， 其 功能 可 以 典型 化 为 对 各 种 还 辑 运 算 的 实现 。 当 网 络 
名 





有 共有 了 个 二 进 制 输入 分 量 时 ， 最 大 不 重复 的 输入 矢量 有 冯 组， 其 输出 矢量 所 能 代表 的 逻 


钳 功 能 总 数 为 22 。 不 幸 的 是 ， 感 知 器 不 能 够 对 任意 的 输入 /输出 对 应 的 关系 《 即 任意 远 
辑 运算 ) 进行 实现 ， 它 只 能 够 实现 那些 在 几 17 中 用 直线 、 平 面 等 进行 线性 分 类 的 问题 ， 
即 感知 器 不 能 够 对 线性 不 可 分 的 输入 矢量 进行 分 类 。 所 谓 线性 可 分 ， 是 指 输入 及 输出 点 集 
是 几何 可 分 的 。 对 于 两 个 输入 的 情形 而 言 ， 输 入 及 输出 点 集 可 用 站 线 来 分 割 ， 对 于 三 个 输 
入 而 言 ， 可 用 平面 米 分 刺 ， 依 此 类 推 ， 对 于 上 个 输入 情形 ， 线 性 可 分 是 指 可 用 r - 1 维 超 
平 而 米 分 制 此 上 维 空间 中 的 点 集 。 

最 惟有 代表 性 的 线性 不 可 分 的 问题 就 是 “ 蜡 或 ”问题 。 到 辑 运算 中 的 “ 异 或 ”功能 ， 
就 是 当 输入 两 个 二 进 制 数 同时 为 站 或 同时 为 1 时 ， 其 输出 为 0， 只 有 当 两 个 输入 中 有 一 个 
为 1 ， 而 另 一 个 为 0 时 ， 续 果 为 1 。 若 着 望 用 感知 器 来 实现 此 巧 能 的 操作 ， 其 输入 应 为 两 
个 二 进 制 数 所 有 可 能 情况 的 组 合 〔〈 共 4 种 )， 然 后 根据 “ 异 或 ”逻辑 荔 能 ， 对 应 出 各 输入 
已 下 的 目标 输出 了 





0011 
已 一 * 了 =[DOl101 
1 ， 0 


毛 求解 的 是 : 设计 一 个 单 层 感 知 器 对 输入 矢量 按期 望 的 输出 矢量 进行 分 类 。 

根据 图 解 ,“ 异 或 ”问题 则 是 要 求 用 一 条 直线 将 平面 上 的 四 个 点 分 成 两 类 。 输 入 矢量 
平面 上 四 点 的 位 置 如 图 1.9 所 示 ， 其 中 ,“x?” 表 示 希 望 将 其 输入 分 为 1 奖 ; “o” 表 示 对 
应 的 目标 输出 为 0。 很 显然 ， 对 于 这 样 的 四 点 位 置 ， 想 用 一 条 直线 把 相同 类 的 期 望 输入 区 
分 开 来 是 不 可 能 的 。 实 际 上 ， 从 逻辑 运算 入 手 ， 可 写 出 感知 器 对 所 有 的 四 组 二 元 素 得 入 所 
对 应 的 全 部 16 种 箱 出 的 情况 ， 它 们 分 别 代表 “与 汶 “或 内 “ 非 入 “与 非 习 “或 非 兴 “ 异 
或 `“ 异 或 非 ” 等 膛 辑 运算 功能 。 在 16 种 逻辑 操作 功能 中 ， 只 有 “ 异 或 (rr =[0110]1" 
和 “ 红 或 非 (=[1001 了 ”是 线性 不 可 分 的 ， 其 他 14 中 还 辑 芒 能 均 为 线性 可 分 ， 它 们 都 
可 以 用 单 层 感知 器 来 实现 。 

在 实际 的 逻辑 运算 中 ， 随 着 运算 变量 数目 的 增加 【〈 即 输入 矢量 r 的 增加 )， 线 性 可 分 
的 情况 所 占 比例 是 相当 少 的 。 表 1.1 给 出 了 不 同 的 输入 > 时 ， 线 性 可 分 的 逻辑 运算 个 数 与 
膛 辑 运算 总 数 的 情况 ， 从 中 可 以 看 出 ， 采 用 感知 器 只 能 解决 很 少 部 分 的 分 类 问题 ， 它 的 应 
用 存在 着 相当 的 局 限 性 。 








到 


图 1.9 “ 尝 或 ”问题 的 图 形 志 示 


表 1.1 不 束 输入 上 时 线性 可 分 的 功能 数 
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域 知 髓 的 线性 下 分 性 限制 是 个 严重 的 问题 。60 年 代 未 ， 人 们 曾 致 力 王 该 问题 的 研究 ， 
并 找到 了 解决 问题 的 办 法 ， 即 变 单 层 网 络 结构 为 多 层 网 络 结构 。 这 实际 上 是 把 感知 器 的 概 
念 拓 展 化 了 。 对 于 这 样 的 “ 蜡 或 ”问题 ， 我 们 可 以 用 两 层 网 络 结构 ， 并 在 降 售 层 中 采用 
两 个 神经 元 ， 即 用 两 条 判决 直线 ?1 和 史 来 解决 。 如 图 1.10(a) 所 示 。 使 *1 线 下 部 分 为 1 ， 
线 上 部 分 为 0， 而 s2 线 的 上 部 为 1 ， 下 部 为 0， 而 在 输出 层 中 使 图 中 阴影 部 分 为 ! 或 1， 
即 可 使 “ 异 或 ”功能 得 以 实现 ， 而 且 其 实现 的 可 能 有 许多 种 。 研 究 表 明 ， 两 层 的 阀 值 网 络 
可 以 实现 任意 的 二 值 逻 辑 函 数 ， 且 输入 俯 不 仅 限于 二 进 制 数 ， 可 以 是 连续 数值 。 需 要 指出 
的 是 ， 训 练 冰 值 型 激活 函数 组 成 的 两 层 感 知 器 ， 所 采用 的 修正 权 值 的 学 习 规 则 ， 仍 然 是 单 
层 感知 器 的 学 习 规则 ， 只 是 对 两 个 单 层 网 络 分 别 各 训练 一 次 而 已 ， 隐 含 层 的 目标 矢量 可 以 
从 14 个 线性 可 分 的 矢量 中 侈 择 那些 将 坐标 平面 上 的 4 个 点 分 别 进 行 I 个 点 和 3 个 点 的 分 
类 ， 并 且 ， 两 条 线 的 单 点 分 类 分 别 取 处 于 对 角 钱 上 点 的 目标 矢量 ， 例 如 可 选择 *s1=[010 
01， 吧 =[003410]， 它们 的 分 类 组 成 图 1.10 (b) 所 示 的 分 类 结果 。 这 样 可 以 避免 由 隐 舍 
层 的 目标 矢量 又 形成 “ 蜡 或 ”问题 ， 即 隐 含 层 的 目标 矢量 的 选取 并 不 是 任意 的 。 实 际 上 ， 
通过 分 折 ， 可 以 得 知 ，51 和 5 各 目 不 同 的 选择 方案 可 组 成 的 隐 含 层 的 肯 标 矢量 的 总 数 只 
有 16 种 。 

另外 ， 解 决 “ 异 或 ”问题 的 方法 当然 是 采用 具有 连续 可 微 激活 函数 作为 隐 含 层 函 数 的 
反 向 传播 网 络 。 与 感知 器 的 不 同 在 于 ， 那 里 对 权 值 训练 所 采用 的 学 习 规则 是 误 其 的 反 向 传 
播 算法 。 





(a) 网络 结构 图 (b 输入 矢量 半 血 图 形 


图 1. 10 “ 蜡 或 ”问题 的 一 种 解决 方案 


1.2 自 适 应 线性 元 件 


自 适 应 线性 元 件 (Adaptive Linear Element， 简 称 Adaiine) 也 是 早期 神经 网 络 模型 之 
一 ， 它 是 由 美国 的 威 德 罗 《〈B. Widrow) 和 霍 夫 〔M. Hoff) 于 1959 年 首先 提出 的 。 它 与 
感知 器 的 主要 不 同 之 处 在 于 其 神经 元 采用 的 是 线性 激活 函数 ， 这 侈 许 输出 可 以 是 任意 值 ， 
而 不 仅仅 只 是 像 感知 器 中 那样 只 能 取 0 或 1 另外 ， 它 采用 的 是 磷 -H 学 习 法 则 ， 人 也 称 最 
小 均 方 差 (LMS) 规 则 对 权 值 进行 训练 ， 从 而 能 够 得 到 比 感 知 器 更 快 的 收 敏 速 度 和 更 高 的 精 
度 。 

自 适 应 线性 元 件 的 主要 用 途 是 线性 坎 近 一 个 通 数 而 进行 模式 联想 。 另 外 ， 它 还 适用 于 
信号 处 理 泪 波 、 预 测 、 模 型 识别 和 控制 。 


1.2.1 自 适 应 线性 神经 元 模型 和 结构 


一 个 具有 上 个 输入 的 自 适应 线性 神经 元 模型 如 图 1. 11 所 示 。 这 个 神经 元 有 一 个 线性 
激活 函数 ， 被 称 为 Adaline， 如 图 1.11( 的 所 未 。 和 感知 器 一 样 ， 偏 差 可 以 用 来 作为 网 络 
的 另 一 个 可 调 参数 ， 提 供 额 外 可 调 的 自由 变量 以 获得 期 望 的 网 络 特性 。 线 性 神经 元 可 以 训 
练 网 络 学 习 -- 个 与 之 对 应 的 输入 /输出 的 函数 关系 ， 吉 线 性 逼近 任意 一 个 非 线性 函数 ， 但 
它 不 能 产生 任何 非 线 性 的 计算 特性 。 

当 引 适应 钱 性 网 络 由 * 个 神经 元 相 并 联 形成 一 层 网 络 ， 此 自 适 应 线性 神经 网 络 又 称 为 
Madaline， 如 图 1. 11 (hb) 所 示 。 

-HB 规则 仅 能 够 训练 单 层 网 络 ， 但 这 并 不 是 什么 严重 问题 。 如 前 面 所 述 ， 单 层 线性 
网 络 与 多 层 线性 网 络 具 有 同样 的 能 力 ， 即 对 于 每 一 个 多 层 线性 网 络 ， 都 具有 一 个 等 效 的 单 
层 线 性 网 络 与 之 对 应 。 

线性 激活 函数 使 网 络 的 输出 等 于 加 权 输 入 和 加 上 偏差 ， 如 图 1. 12 所 示 。 此 函数 的 输 
入 /和 输出 关系 为 : 








入 = 和 成 友 #PA+ 熙 = 证 +P 十 吾 (1 .87 





(al 所 daline fb) Madaline 


图 1.11 自 逢 应 线性 神经 网 络 的 结构 





ta 没有 偏差 的 线性 激活 函数 {b) 带 有 侦 差 的 线性 激活 函数 
网 1. 12 线性 激活 甫 数 


1.2.2 WH 学 习 规 则 及 其 网 络 的 训练 


W-H 学 习 规 则 是 由 感 德 罗 和 霍 夫 提 出 的 用 来 修正 权 矢 量 的 学 习 规 则 ， 所 以 用 他 们 两 
人 姓氏 的 第 一 个 字母 来 俞 名 。 允 -和 开 让 以 用 米 训 练 一 层 网 络 的 权 值 和 偏差 使 之 线性 地 通 近 
一 个 通 效 而 进行 模式 联想 (Pattermm 和 Association)。 
定义 一 个 线性 网 络 的 和 输出 误差 函数 为 : 
] 


E(V,B)=5B- 鱼 =55-wP- 呈 (1.9) 


出 (1.9) 式 可 以 看 出 : 线性 网 络 具 有 扼 物 线 型 误差 函数 所 形成 的 误差 表面 ， 所 以 只 有 一 
个 误差 最 小 值 。 通 过 交 - 了 学 习 规则 来 计算 权 值 和 偏差 的 变化 ， 并 使 网 络 误差 的 平方 和 最 
小 化 ， 总 能 够 训练 一 个 网 络 的 误差 趋 于 这 个 最 小 值 。 另 外 ， 很 显然 ，EW.B) 只 取 识 于 网 络 
的 权 值 及 目标 失重。 我 们 的 目的 是 通过 调节 权 矢 量 ， 使 互 多 下 达到 最 小 值 。 所 以 在 给 定 
玫 凤 有 后 ， 利 用 更 -H 学 习 规 则 修正 权 和 失 量 和 人 恼 差 矢量 ， 使 丈 厂 B) 从 误差 空间 的 某 一 点 开 
始 ， 沿 着 瑟 凤 中 的 斜面 向 下 靖 行 。 根 据 梯 度 下 降 法 ， 权 和 拓 量 的 修正 值 正 比 于 当前 位 置 .上 
开 W.B) 的 梯度 ， 对 于 第 ii 个 输出 节点 有 : 


OF 
Aw = 一 一 =? 世 一 ai]p， (L.10) 
9 
或 表示 为 : 
Ap =16， (1.11b) 


这 里 5 ;定义 为 第 i 个 输出 节点 的 误差 : 





(1 站 式 称 为 W-H 学 习 规 则 ， 又 叫 全 规则， 或 为 最 小 均 方 差 算 法 (LMS)。 殉 -H 学 习 
规则 的 权 值 变化 量 正 比 于 网 络 的 输出 误差 及 网 络 的 输入 矢 星 ， 它 不 央求 导数 ， 所 以 算法 简 
单 ， 又 只 有 上 收 仇 速度 快 和 精度 高 的 优点 。 

人 《1.11) 式 中 了 为 学 习 速 率 。 在 -- 般 的 实际 运用 中 ， 了 通常 取 一 接近 ] 的 数 ， 或 取 值 为 : 

















] 
一 站 .9 龟 芋 1 .13) 
了 Imax[aet( 严 * 叫 " 





这 样 的 选择 可 以 达到 既 快 速 又 正确 的 结果 。 

自 适 应 线性 元 件 的 网 络 训 练 过 程 可 以 归纳 为 以 下 三 个 步 妓 ， 

员 表 过: 计算 训练 的 得 出 矢量 4 = Wx#P + 中 ， 以 及 与 期 望 答 出 之 间 的 误 匡 到 = 了- 4: 

名 检查 : 将 网 络 箱 出 误差 的 半 方 和 与 期 电 误 差 相 比 较 ， 如 果 其 值 小 于 期 扎 误 莽 ， 或 训 
练 己 达 到 事先 设 定 的 最 大 训练 次 数 ， 则 停止 训练 。 否 则 继续 : 

志学 习 : 采用 WwW-H 规 则 计算 新 的 可 位 和 偏 花 ， 并 返回 到 全 。 

每 进行 一 次 上 述 三 个 步骤 ， 被 认为 是 完成 -个 训练 循环 次 数 。 

如 果 网 络 训练 获得 成 功 ， 那 么 当 - ' 个 不 在 训练 中 的 输入 和 失 量 输入 到 网 络 中 时 ， 网 络 趋 
于 产生 一 个 与 其 相 联想 的 输出 矢 明 。 这 个 特性 被 称 为 演化， 这 在 函数 通 近 以 及 输入 振 分 
类 的 应 用 中 是 相当 有 用 的 。 如 果 经 过 训练 ， 网 络 仍 不 能 达到 期 望 日 标 ， 可 以 有 两 种 选择 ， 
或 检查 一 下 所 要 解决 的 问题 ， 是 否 适 用 于 线性 网 络 ; 或 对 网 络 进行 进一步 的 训练 。 

旦 然 只 运用 于 线性 网 络 ， 允 -了 规则 仍然 旦 重要 的 ， 因 为 它 展现 了 梯度 下 降 法 是 如 何 
来 训练 一 个 网 络 的， 此 概念 后 来 发 展 成 反 向 传播 法 ， 使 之 可 以 训练 多 妈 非 线性 网 络 ， 











1.3 反 向 传播 网 络 


1.3.1 友 向 传播 网 络 模型 与 结构 


反问 传播 网 络 (Back-Propagation Network， 简 称 BP 网 络 ) 昆 对 非 线性 可 微分 胃 数 进 
行 权 值 训练 的 多 层 前 向 网 络 。 在 人 工 神 经 网 络 的 实际 应 用 中 ，80 驳 -90 名 的 人 工 神经 网 络 
模型 是 采用 BP 网 络 或 它 的 变化 形式 ， 它 主要 用 于 以 下 几 个 方面 :中 函数 和 逼 近 : 用 输入 拓 
各 和 相应 的 输出 矢量 训练 一 个 网 络 有 逼近- 一 个 函数 :名 模式 识别 ， 用 - 个 特定 的 输出 矢量 将 
它 与 输入 矢量 联系 起 米 ; 加 分 类 : 把 输入 矢量 以 所 定义 的 合适 方式 进行 分 类 : 名 数据 应 纳 ; 
减少 答 出 矢量 维 数 以 便于 传输 或 存储 。 可 以 说 ，BP 网 络 是 人 工 神 经 网 络 中 前 向 网 络 的 核 
心 内 容 ， 体 现 了 人 工 神经 网 络 最 精华 的 部 分 。 在 人 们 掌握 反 庙 传播 网络 的 设计 之 前 ， 感 知 
器 和 上 自 适应 线性 元 件 玫 只 能 适用 于 对 单 层 网 络 模型 的 训练 ， 只 总 在 BP 网 络 出 现 帮 才 得 到 
了 进一步 拓展 。 




















一 个 遇 有 了 个 答 入 和 一 个 隐 合 技 的 神经 网 络 模型 结构 如 图 1.13 所 示 。 








图 1. 13 具有 一 个 隆 含 居 的 神经 网 络 模型 结构 图 
感知 器 和 自 适 应 线性 元 件 的 主要 差别 在 激活 函数 上 : 前 者 是 二 值 型 的 ， 后 者 存 线 性 
的 。 反 向 传播 网 络 具 有 一 层 或 多 层 隐 含 屋 ， 除 了 在 多 层 网 络 结构 上 与 前 商 已 介绍 过 的 异型 
有 不 同 外 , 其 主要 差别 还 表现 在 激活 了 芋 数 上 。 反 向 传播 网 络 的 激活 函数 必须 十 处 处 可 微 的 ， 
所 以 它 就 不 能 采用 二 值 型 的 由 值 兽 数 {0，11 或 符号 函数 {-1，1j， 反 向 传播 网 络 经 常 使 用 的 
是 S$ 型 激活 函数 。 此 种 激活 通 数 常用 对 数 或 双 曲 正切 等 一 类 3 形状 的 曲线 来 表示 ， 如 对 
数 S 型 激活 函数 关系 为 ; 


1 
/= 于 exp[ 一 (天 士 间 ] 

而 观 曲 正切 S$ 型 曲线 的 输入 /输出 调 数 关系 为 : 
_I 一 expE-2(8 士 吕 ] 
了 + exp[ 一 2 十 为] 
图 1.14 所 示 的 是 对 数 $ 型 激活 函数 的 图 形 。 可 以 看 到 六 )] 是 一 个 连续 可 微 的 函数 ， 
它 的 一 阶 导 数 存在 。 对 于 多 层 网 络 ， 这 种 激活 表 数 所 划分 的 区 域 不 再 是 线性 划分 ， 而 是 由 
一 个 非 线性 的 超 平 面 组 成 的 区 域 。 它 是 比较 和 柔和、 光滑 的 任意 界面 ， 因 而 它 的 分 类 比 线 性 
划分 精确 、 人 合理， 这 种 网 络 的 容错 性 较 好 。 另 外 一 个 重要 的 特点 是 由 于 激活 函 煞 是 连续 可 
徽 的 ， 它 可 以 严格 利用 梯度 法 进行 推 御 ， 它 的 权 值 修正 的 解 禄 式 十 分 明确 ， 其 算法 被 称 为 


(1.14) 


{1.197》 








(a) 对 数 $ 型 激活 函数 tb) 带 有 偏 英 的 双 曲 正切 S 型 激活 函数 
几 1.14 了 网 络 5 型 激活 明 数 
误差 反 疝 传播 法 ， 也 简称 BP 算法 ， 这 种 隔 络 也 称 为 BP 网 络 。 
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因为 $ 卉 冰 数 具 有 非 线性 放大 系数 功能 ， 它 可 以 把 输入 从 负 无 穷 大 到 正 无 穷 大 的 信 
号 ， 变 换 成 -1 到 1 之 问 输 出 ， 对 较 大 的 输入 信号 ， 放 大 系数 较 小 ， 而 对 较 小 的 输入 信和 并， 
履 大 系数 则 较 大 ， 所 以 采用 S 型 激活 冰 数 可 以 去 处 理 和 腺 近 非 线 性 的 输入 /输出 关系 。 

不 过 ， 如 果 在 输出 层 采 用 3 型 函数 ， 输 出 则 被 限制 到 一 个 很 小 的 范围 了 ， 孝 条 用 线 
性 激活 函数 ， 则 可 使 网 络 输 出 任何 值 。 所 以 只 有 当 希 望 对 网 络 的 输出 进行 限制 ， 如 限制 在 
0 和 1 之 间 ， 那么 在 输出 层 庶 当 包 售 $ 型 激活 函数 ， 在 … 般 情况 下 ， 均 是 在 隐 售 层 采 用 $ 
型 激活 函数 ， 而 和 输出 层 采 用 线性 激活 函数 。 


1.3.2 Bp 算法 


BP 两 络 的 产生 归功 于 BP 算法 的 获得 。BP 算法 属于 5 算法， 是 一 种 监督 式 的 学 习 算 
法 。 其 主要 思想 为 : 对 于 4 个 输入 学 习 样本 : 瑚 ， 户 ，.……， 疡 ， 已 知 与 其 对 应 的 输出 样本 
为 : 歼 ， 开 ，… 四。 学 习 的 目的 是 用 网 络 的 实际 输出 4，4?，…，4 与 目标 矢量 了 1， 玖 ，.… 
再 之 间 的 误差 来 修改 其 权 值 ， 使 4 Ga = 1 2. …, 的 与 期 望 的 下 尽 可 能 的 接近 ， 即 : 使 网 络 
输出 层 的 误差 平方 和 达到 最 小 。 它 是 通过 连续 不 断 地 在 相对 于 误差 函数 斜率 下 降 的 方向 上 
计算 网 络 权 值 和 偏差 的 变化 而 逐渐 逼近 目标 的 。 每 一 次 权 值 和 偏差 的 变化 都 与 网 络 误差 的 
影响 成 正比 ， 并 以 芭 向 忧 播 的 方式 传递 到 每 “后 的 。 

BP 算法 是 由 两 部 分 组 成 : 信息 的 正 向 传递 与 误差 的 反 向 传播 。 在 正 向 传播 过 程 中 ， 
输入 信息 从 输入 经 隐 含 层 和 逐 层 计算 传 向 输出 层 ， 每 一 层 神经 元 的 输出 作用 于 下 一 层 神经 元 
的 输入 。 如 果 在 输出 技 没 有 得 到 期 望 的 输出 ， 则 计算 输出 层 的 误差 变化 值 ， 然 后 转向 反 向 
传播 ， 通 过 网 络 将 误差 信和 叶 沿 原来 的 连接 通路 反 传 回来 修改 各 层 神 经 元 的 权 值 直至 达到 期 
望 目标 。 

为 了 明确 起 见 ， 现 以 图 1.15 所 示 两 层 网 络 为 例 进行 BP 算法 推导 。 























一 2 
了 三 了 2 


图 1.15 具有 ~- 个 隐 含 层 的 简化 网 络 图 
设 和 输入 为 P， 输 入 神经 元 有 > 个 ， 隐 会 层 内 有 851 个 神经 元 ， 激 活 函 数 为 El， 输出 层 
内 有 弛 个 神经 元 ， 对 应 的 激活 函数 为 忆 ， 输 出 为 4， 目标 矢量 为 了 。 
1) 信息 的 正人 向 待 递 
0) 隐 含 屋 中 第 了 个 神经 元 的 输出 为 


al = Fl( 立 wy 上 Di 1 2 31 (1.16) 
1 
(2)》 输出 层 第 二 个 神经 元 的 输出 为 
] 
a24 = 2( 双 w24al + 四 = 2 .22 (L17) 
=1 
(3) 定义 误差 图 数 为 
1 52 
{ 歼 , 呈 ) = 一 工 ( 纺 一 2 ) 【1.19) 
2K=1l 


2 ) 惠 用 梯度 下 降 法 来 权 值 变化 及 误差 的 反 向 传播 
(1) 和 输出 靶 的 权 值 变化 











对 从 第 工 个 输入 到 第 大 个 输出 的 权 值 有 : 
3 3E aa2， 
Aw2， =- =- . 
“0 (1L.19) 


=1( 一 上 2 2a = 及.6u .al 








5 = 2 一 2) 72 = (1.20) 
E 一 此 一 628 (1.21) 
同 理 可 得 : 
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(2 ) 隐 人 钨 层 权 值 变 化 
对 从 第 了 个 输入 到 第 :个 输出 的 权 值 ， 有 : 
8 BE。 9a2k 9al; 














点 MWL 三 一 一 一 ! - 
二 5 oali 9wli 
2 
= 了 > (一 a26 2.w26 Di {1.23) 
5=] 
= 人 35 
22 
65 =e jl， 刀 ; 一 了 人 2 《1.24) 
大 = 


同 埋 可 得 : 


3 ) 误差 反 人 向 传播 的 流程 图 与 图 形 解释 
误差 反 装 似 播 过 程 实际 上 是 道 过 计算 输出 层 的 误 益 & ， 然 后 将 其 与 输出 层 激 活 函 数 
的 一 阶 导数 闫 ” 相 乘 来 求 得 56 。 山 于 陷 食 层 中 没有 和 直接 给 出 目标 大 盘 ， 所 以 利用 箱 出 发 
32 
类 =] 


并 同样 通过 将 ei; 与 该 度 激 活 函 数 的 一 阶 导 数 六 相 了 乘 ， 而 求 得 6 ， 以 此 求 出 前 层 权 值 的 
变化 芋 Awlyz 。 如 果 前 而 还 有 隐 含 屋 ， 治 用 上 述 同样 方法 依 此 类 推 ， 一 直 和 将 输出 误 车 ex 一 
层 一 层 的 皮 推 算 到 第 一 层 为 止 。 几 1.16 给 出 了 形象 的 解释 。 





了 = 了 了 
网 1. 16 误差 反 向 传播 法 的 图 形 解 释 


1.3.3 BP 网 络 的 设计 





在 进行 BP 网 络 的 设计 时 ， 一 般 应 从 网 络 的 层 效 、 每 层 中 的 神经 元 个 煞 和 激活 函数 、 
初始 值 以 及 学 习 速 滨 等 几 个 方面 来 进行 考虑 。 下 面 讨论 一 下 各 自选 取 的 原则 。 

1) 网 络 的 层 数 

理论 上 已 经 证 明 : 具有 偏 荆 和 至 少 一 个 $ 型 隐 含 层 加 上 一 个 线性 输出 层 的 网 络 ， 能 
够 逼近 任何 有 理 函 数 。 这 实际 上 已 经 给 了 我 们 一 个 基本 的 设计 BP 网 络 的 原则 。 增 加 层 数 
主要 可 以 更 进一步 地 降低 误差 ， 提 高 精度 ， 但 同时 也 使 网 络 复 杂 化 ， 从 而 增加 了 网 络 权 值 
的 训练 时 间 。 而 误差 精度 的 提高 实际 上 也 可 以 通过 增加 隐 含 屋 中 的 神经 元 数目 米 获得 ， 其 
训练 效果 也 比 增加 层 数 更 容易 观察 和 调 束 。 所 以 一 般 情况 下 ， 应 优先 考虑 增加 隐 含 层 中 的 
神经 元 数 。 

另外 还 有 一 个 问题 ;能 不 能 仅 用 具有 非 线性 激活 苹 数 的 单 层 联络 来 解决 问题 呢 ? 结论 
是 : 没有 必要 或 效果 不 好 。 因 为 能 用 单 层 非 线性 网 络 完美 解决 的 问题 ， 用 自 适应 线性 网 络 
一 定 也 能 解雇 ， 而 卫 归 适应 线性 网 络 的 运算 速度 还 现 快 。 而 对 于 只 能 用 间 线 性 阔 数 解决 的 
问题 ， 单 层 精度 艾 不 够 商 ， 也 只 有 增加 层 数 才能 达到 期 望 的 结果 。 这 主要 还 旦 因为 一 层 网 

]7 























络 的 补 经 元 数 被 所 要 解决 的 问题 本 身 限制 造成 的 。 对 于 一 般 可 用 一 层 解 决 的 问题 ， 应 当 首 
先 芍 虑 用 二 知 器 ， 或 白 适 应 线性 网 络 来 解决 ， 而 不 采用 非 线 性 网 络 ， 因 为 单 层 不 能 发 挥 出 
非 线性 激活 男 数 的 特长 。 

输入 神经 元 数 可 以 根据 需要 求解 的 问题 和 数据 所 表示 的 方式 来 确定 。 如 果 输 入 的 是 电 
压 波 形 , 奢 么 可 根据 电压 波形 的 采样 点 数 来 决定 输入 神经 元 的 个 数 , 也 可 以 用 一 个 神经 元 ， 
使 输入 样本 为 采样 的 时 间 序 列 。 如 果 输 入 为 图 像 ， 则 输入 可 以 用 图 像 的 像素 ， 也 可 拟 为 经 
过 处 理 后 的 图 像 特 征 米 确定 其 神经 元 个 数 。 总 之 问题 确定 后 ， 输 入 与 输出 居 的 神经 元 数 就 
随 之 定 了 。 在 设计 中 应 当 注 意 尽 可 能 地 减少 网 络 模型 的 规模 ， 以 便 减 少 网 络 的 训练 时 间 。 

2) 隐 念 层 的 神经 元 数 

网 络 训练 精度 的 所 高 ， 可 以 通过 采用 一 个 隐 含 层 ， 而 增加 其 神经 元 煞 的 方法 米 获 得 ， 
这 在 结 梅 实现 上 ， 要 比 增 加 更 多 的 陷 含 层 要 简单 得 多 。 那 么 究竟 选取 多 少 个 隐 含 层 节 点 才 
合适 ? 这 在 理论 上 并 没有 一 个 明确 的 规定 。 在 具体 设计 时 ， 比 较 实 际 的 做 竺 十 通过 对 不 同 
神经 元 数 进行 训练 对 比 ， 然 后 适当 的 加 上 一 点 余 量 。 

3) 初始 权 值 的 选取 

由 于 系统 古 非 线性 的 ， 初 始 值 对 于 学 习 是 否 达 到 局 部 最 小 、 是 否 能 够 收 化 以 及 训练 时 
阅 的 长 短 的 关系 很 大 。 如 果 初 始 权 值 太 大 ， 使 得 加 权 后 的 输入 和 中 沙 在 了 S 型 激活 函数 


的 饱和 区 ， 从 而 导致 其 民 数 户 (8?) 非 销 小 ， 而 在 计算 权 值 修正 公式 中 ， 因 为 8e 广 (0 ， 当 








大 (9 一 0 时 ， 则 有 ->0。 这 使 得 Awi 一 0， 从 而 使 得 调节 过 程 几 平 停顿 下 米 。 所 以 ， 


一 般 总 是 希望 经 过 初始 加 权 后 的 每 个 神经 元 的 输出 值 都 接近 于 零 ， 这 样 可 以 保证 每 个 神经 
元 的 权 值 都 能 够 在 它们 的 S 型 激活 函数 变化 最 大 之 处 进行 调节 。 所 以 ， 一 般 取 初 始 权 值 
在 (-1.0) 之 闻 的 随机 数 。 另 外 ， 为 了 防止 上 述 现 象 的 发 生 ， 感 得 罗 等 人 在 分 析 了 两 层 网 络 


是 如 人 钉 对 一 个 函数 进行 训练 后 ， 提 出 一 种 选 定 初始 权 值 的 策略 : 选择 权 值 的 量 级 为 ysl ， 


共 中 si 为 第 一 层 神经 元 数 日 。 利 用 他 们 的 方法 可 以 在 较 少 的 训练 次 数 下 得到 满意 的 训练 
结果 ， 其 方法 仅 需要 使 用 在 第 一 微 含 层 的 初始 值 的 选取 上 ， 后 面 层 的 初始 值 仍 然 采 用 随机 
取 数 。 

4) 学 习 速 率 

学 习 速 率 潜 定 每 一 次 循环 训练 中 所 产生 的 权 值 变化 量 。 大 的 学 习 速 率 可 能 导致 系统 的 
不 稳定 ; 但 小 的 学 习 速 率 导 致 较 长 的 吕 练 时 间 ， 可 能 收 和 化 很 慢 ， 不 过 能 保证 网 络 的 误差 值 
不 跳出 误差 表 而 的 低谷 而 最 终 趋 于 最 小 误差 值 。 所 以 在 一 般 情 况 下 ， 倾 向 于 填 取 较 小 的 学 
习 速 率 以 保证 系统 的 称 定 性 。 学 习 速 率 的 选取 范围 在 0.01 一 0.8 之 闻 。 

和 初始 权 值 的 选取 过 程 一 样 ， 在 一 个 神经 网 络 的 设计 过 程 中 。 网 络 要 经 过 几 个 不 同 的 


党 习 速 率 的 训练 ， 通 过 观察 每 一 次 训练 后 的 误差 平方 和 于 e: 的 下 降 速 率 来 判断 所 选 定 的 


学 习 速 率 是 否 合适 。 如 果 开 e 下 降 很 快 ， 则 说 明 学 习 速 率 合适 ， 若 工 e: 出 现 振荡 现象 ， 
则 阐明 学 习 速 率 过 大 。 对 于 等 一 个 具体 网 络 都 存在 一 个 人 台 适 的 学 习 速率 。 人 避 对 于 较 复 杂 网 





aa 


络 ， 在 误差 册 面 的 不 同 部 位 可 能 需要 不 同 的 学 习 速 率 。 为 了 减少 寻找 学 习 速 率 的 训练 次 数 
以 及 证 练 时 间 ， 比 较 合 适 的 方法 是 采用 变化 的 自 适 应 学 习 速 率 ， 使 网 络 的 训练 在 不 癌 的 阶 
段 自动 设置 不 同学 习 速 率 的 大 小 。 这 一 方法 将 在 后 面 讨 论 。 

5) 期 望 误 差 的 选取 

在 设计 网 络 的 训练 过 程 中 ， 期 望 误差 值 也 应 当 通 过 对 比 济 练 后 确定 一 个 合适 的 仁 ， 这 
个 所 谓 的 “合适 *， 是 相对 于 所 需要 的 隐 含 层 的 节点 数 来 确定 ， 因 为 较 小 的 期 望 误差 值 丰 
要 靠 增加 隐 会 层 的 节点 ， 以 及 证 练 时 间 米 获得 的 。 一 般 铺 况 下 ， 作 为 对 比 ， 可 以 同时 对 两 
个 不 同期 望 误 半 舍 的 网 络 进行 训练 ， 最 后 通过 毕 合 因素 的 考虑 来 确定 采用 其 中 一 个 网 络 。 





1.3.4 BP 网 络 的 限制 与 不 足 


昌 然 反 向 传播 法 得 到 广泛 的 应 用 ， 但 它 也 存在 自身 的 限制 与 不 足 ， 其 主要 表 项 在 它 的 
训练 过 程 的 不 确定 上 。 有 具体 说 明 如 下 : 

1) 需要 较 长 的 训练 时 间 

对 于 一 些 复杂 的 问题 ，BP 算法 可 能 要 进行 几 小 时 甚至 更 长 的 时 间 的 训练 。 这 主要 是 
出 于 学 习 速 率 太 小 所 造成 的 。 可 采用 变化 的 学 习 速 率 或 让 适应 的 党 习 速 率 来 如 以 改进 。 

2 ) 完全 不 能 训练 

这 主要 表现 在 网 络 出 现 的 麻 粒 现象 上 。 在 网 络 的 训练 过 程 中 ， 当 其 权 值 酒 得 过 上 大， 可 
能 使 得 所 有 的 或 大 部 分 神经 元 的 加 权 总 和 偏 大 ， 这 使 得 激活 函数 的 输入 工作 在 S 型 转移 
函数 的 人 也 和 区 ， 导 致 其 导数 六 全 非常 小 ， 从 而 使 得 对 网 络 权 值 的 调节 过 程 几乎 停 顿 下 来。 
通 汕 为 了 避免 这 种 现象 的 发 生 ， 一 是 选取 较 小 的 初始 权 和 但， 另外 ， 采 用 较 小 的 学 习 速 率 ， 
但 这 又 增加 了 训练 时 间 。 

3) 局 部 极 小 惜 

BP 算法 可 以 使 网 络 权 值 收 伍 到 一 个 和 解 ， 但 它 并 不 能 保证 所 求 为 误差 超 半 面 的 全 局 最 
小 解 ， 狠 可 能 是 一 个 局 部 极 小 解 。 这 是 因为 BP 算法 采用 的 是 梯度 下 降 法 ， 训 练 是 从 某 一 
起 始点 沿 误 差 函 数 的 斜面 逐渐 达到 误差 的 最 小 值 。 对 于 复杂 的 网 络 ， 共 误 盖 函 数 为 多 维 空 
闻 的 曲面 ， 就 像 一 个 硫 ， 其 确 底 是 最 小 值 点 。 但 是 这 个 硫 的 表面 是 四 凸 不 平 的 ， 因 而 在 对 
其 训练 过 程 中 ， 可 能 陷入 某 一 小 谷 区 ， 而 这 一 小 和 谷 区 产生 指 是 一 个 局 部 航 小 值 。 山 此 点 向 
各 方向 变化 均 使 误差 增加 ， 以 致 于 使 训练 无 法 逃 出 这 一 局 部 极 小 值 。 

解决 BP 网 络 的 训练 问题 还 需要 从 训练 算法 上 下 工大 。 在 下 一 章 中 ， 桨 介绍 儿 种 有 效 
的 训练 BP 网 络 的 快速 算法 。 











第 2 章 网 络 训练 优化 算法 


对 于 前 向 神经 网 络 的 训练 ， 可 以 等 价 地 转化 为 以 下 求 极 值 的 问题 : 在 一 个 了 维 输入 空 
闻 半 =[x x2 和]， 对 于 所 定义 的 目标 函数 FAX) 求 其 极 小 值 ， 之 所 以 采用 目标 函数 而 
不 使 用 误差 函数 是 因为 有 时 性 能 指标 中 包含 有 误差 之 外 的 项 ， 并 且 可 能 较 复 杂 。 由 于 
7(CX) 的 复杂 性 ， 通 常 求助 于 选 代 算法 以 有 效 地 搜索 输入 空间 。 在 欠 代 下 降 法 中 ， 下 一 点 
的 X 人 和 由 当前 点 着 罗 沿 方 向 矢量 SCX() 前 进一步 而 确定 ， 即 可 由 (2.0 式 统一 表示 : 

大 全 1 = 着 (二 用 (3( 基 优 )) (2.1) 

其 中 ，7? 的 是 正 的 步 长 ， 控 制 沿 该 方向 增加 的 数量 。 在 神经 网 络 的 研究 中 ， 称 共 为 学 习 速 
率 : 大 表示 当前 的 迁 代 次 数 。 

选 代 下 降 法 一 般 分 两 步 计 算 第 天 步 的 DUOS(Z (097 首先 确定 方向 7? 人) ， 随 后 计算 步 
长 SCX 的 ) 。 而 第 4 + 1 步 的 计算 应 满足 以 下 不 等 式 ， 





在 一 般 对 梯度 算法 的 不 同 改进 方法 中 ， 基 本 差异 在 于 以 第 上 步 确 定 第 大 + 1 步 的 方向 
上 。 一 旦 确定 了 方向 ， 所 有 算法 都 是 朝 着 由 X 人 区 和 方向 SEO) 所 确定 直线 上 的 极 小 点 移 
动 。 如 果 直 线 下 降 方向 SCXK) 旦 在 目标 函数 的 梯度 基础 上 确定 的 ， 那 么 这 种 下 降 法 就 称 
为 梯度 下 降 法 。 

昌 然 反 向 传播 法 得 到 广泛 的 应 用 ， 但 由 于 采用 的 是 梯度 下 降 法 ， 所 以 它 存在 着 自身 的 
限制 与 不 足 ， 其 主要 表现 在 其 训练 时 间 过 长 并 易于 陷入 局 部 柜 小 值 。 实 际 上 ， 传 统 的 基于 
标准 梯度 下 降 法 的 BP 算法 在 求解 实际 问题 时 常 因 收 敏 速 度 太 慢 而 影响 求解 质量 。 因此, 80 
年 代 中 期 以 来 ， 许 多 研究 人 员 对 其 做 了 深入 的 研究 ， 人 们 在 标准 BP 算法 的 基础 上 ， 进 行 
了 许多 有 益 的 改进 , 主要 日 标 基 为 了 加 快 训练 速度 , 避免 陷入 局 部 航 小 值 和 改善 其 它 能 力 。 
另外 ， 还 提出 了 不 少 基 于 非 线 性 优化 的 训练 算法 ， 可 使 网 络 训练 的 收 伍 速度 比 标准 梯度 下 
降 法 快 数 十 乃至 数 百 倍 。 

本 章 试 图 通过 对 几 种 具有 代表 性 的 改进 算法 性 能 上 的 对 比 ， 从 实用 的 划 度 提醒 人 们 注 
意 这 样 一 个 事实 ， 那 就 是 ， 除 了 某 于 标准 梯度 下 降 法 可 以 进行 算法 改进 外 ， 茜 于 数值 优化 
方法 的 改进 算法 可 能 得 到 意 想 不 到 的 惊人 的 收敛 速度 。 因 此 , 我 们 将 改进 算法 分 为 两 大 类 ， 
第 一 类 为 基于 标准 梯度 下 降 的 改进 方法 ， 它 们 是 由 标准 梯度 下 降 法 发 展 而 来 ， 其 中 ， 选 用 
的 有 附加 动量 的 卫 算法 ， 可 变 学 习 速 率 的 耳 算法 和 弹性 BP 算法 。 第 一 类 方法 为 基于 标 
并 数 值 优 化 的 改进 方法 ， 共 中 ， 选 用 共 斩 梯度 法 、 拟 牛顿 法 和 Levenberg-Marquardt 泪 。 

下 面 ， 首 先 给 出 各 种 算法 的 计算 公式 及 共 工 作 原 迎 ， 并 从 理 沦 上 分 析 各 自 的 优 缺 点 ， 
然后 用 两 个 实例 详细 进行 性 能 的 对 比分 析 ， 最 后 给 出 小 结 。 





2 加 


2.1 基于 标准 梯度 下 降 的 方法 


标准 的 BP 算法 是 基 才 梯度 下 降 法 ， 通 过 计算 日 林 蚁 数 对 网 络 权 伍 及 其 策 状 的 梯度 对 
其 进行 修正 的 ， 改 进 的 算法 都 是 在 标准 的 梯度 下 降 法 的 基础 上 发 展 而 来 的 ， 它 们 均 只 用 到 
目标 范 数 对 权 值 和 偏 莽 的 一 阶 导 数 〈 樟 度 ) 信息 。 

标准 梯度 下 降 法 权 值 和 仿 置 值 修正 的 送 代 过 程 可 以 表示 为: 


筷 坊 +) 二 站 全 一 TY (0 ) 《2.3) 








其 中 ， 斑 约 为 出 网 络 的 所 有 的 权 和 全 和 偏 置 值 组 成 的 向 量 ， 妖 为 学 习 速率 : FX OO) 为 目标 
画 数 ，VYFOx 9) 表示 目标 数 的 梯度 。 

标准 BP 算法 虽然 为 训练 网 络 提供 了 简单 有 效 的 方法 ， 但 由 于 在 训练 过 程 中 学 习 速率 
站 为 一 个 较 小 的 带 数 , 因而 使 它 存 在 着 收 和 化 速度 慢 以 及 局 部 极 小 问题 。 为 了 解决 这 些 问题 ， 
人 们 提出 了 许多 改进 算法 。 其 中 ， 比 较 有 代表 性 的 有 以 下 几 种 。 





2.1.1 附 加 动量 ; 


附加 动 旦 法 使 网 络 在 修正 其 权 人 时， 不 仅 考虑 误差 在 梯度 上 的 作用 ， 而 且 痢 虑 在 误差 
曲面 上 变化 趋势 的 影响 ， 其 作用 如 同一 个 低 通 滤波 器 ， 它 允许 网 络 忽略 网 络 上 的 微小 变化 
特性 。 在 没有 附加 动量 的 作用 下 ， 网 络 可 能 陷入 浅 的 局 部 极 小 值 ， 利 用 附加 动量 的 作用 则 
有 可 能 滑 过 这 些 极 小 值 。 

该 方法 足 在 反问 传播 法 的 基础 上 在 每 一 个 权 值 的 变化 上 加 上 一 项 正比 于 前 次 权 值 变 
化 量 的 值 ， 并 根据 反 启 传播 法 来 产生 新 的 权 值 变化 。 附 加 动量 的 BP 算法 的 权 值 修正 的 选 
代 过 程 可 以 表示 为 : 





AA 各 过 +D) 一 mewA 先 过) -GPaejsTYF(X 起 让 《2.4) 


其 中 灰 为 训练 次 数 ，mae 为 动量 因子 ， 一 般 取 0.95 左右 。 

附 如 动量 法 的 实质 是 将 最 后 一 次 权 值 变化 的 影响 ， 通 过 一 个 动量 因子 来 传递 。 当 动量 
因子 取 值 为 零 时 ， 权 值 的 变化 仅 是 根据 梯度 下 降 法 产生 : 当 动 量 因子 取 值 为 1 时 ， 新 的 权 
值 变 化 则 是 设置 为 最 后 一 次 权 值 的 变化 ， 而 依 梯 彦 法 产生 的 变化 部 分 虽 被 忽略 掉 了 。 以 此 
方式 ， 当 增加 了 动 昌 项 后 ， 促 使 权 值 的 调节 向 着 误差 肌 面 底部 的 学 均 方 向 变化 ， 当 联络 权 


值 进入 误差 曲面 底部 的 平坦 区 时 ， 梯 度 将 变 得 很 小 ， 于 是 ，AX 此 四 = AX 的 ， 从 而 防止 





了 AX 全 + =0 的 出 现 ， 有 助 于 使 网 络 从 误差 晶 面 的 局 部 极 小 值 中 跳出 。 
根据 附加 动量 法 的 设计 原则 ， 当 修正 的 权 值 在 误差 中 导致 太 大 的 增长 结果 时 ， 新 的 权 
值 应 被 取消 而 不 被 采用 ， 并 使 动量 作用 停止 下 来 ， 以 使 网 络 不 进入 较 类 误差 曲面 ， 当 新 的 
误 莽 变化 率 对 其 旧 值 超过 一 个 事先 设 定 的 最 太 误 差 变 化 率 时 ， 也 得 取消 所 计算 的 权 值 变 
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化 。 上 兵 最 人 误差 变化 率 可 以 吡 任何 大 于 或 每 于 1 的 值 。 典 型 的 值 取 1.04。 所 以 在 进行 附加 
动 基 法 的 训练 程序 设计 时 ， 必 须 加 进 条 件 判 断 ， 以 正确 使 用 共 权 值 修正 公式 。 
训练 程序 中 对 采用 动量 法 的 判断 条 件 为 : 


0 SSE > 39 人 .1.04 
11C= 1 0 是 ( <S9 百 做 (2.5) 
pe 其 他 


共 中 ，43SE 为 网 络 的 输出 误差 平方 和 。 

在 附加 动量 的 作用 下 ， 当 网 络 的 训练 误 半 落 入 局 部 极 小 值 后 ， 能 够 产生 一 个 继续 向 前 
的 正 向 斜率 的 运动 ， 并 跳出 较 浅 的 峰值 ， 落 入 全 局 最 小 值 。 然 后 ， 仍 然 在 附加 动量 的 作用 
下 ， 达 到 一 定 的 高 度 后 《〈 即 产生 了 -- 个 SB 人 > SSEKD *1.04》 自动 返回 ， 并 像 弹 子 深 
动 一 样 来 回 摆动 ， 直 至 停留 在 最 小 值 点 上 。 

通过 实际 应 用 我 们 发 现 ， 训 练 参数 的 选择 对 采用 动量 法 的 网 络 训练 效果 的 影响 是 相当 
大 的 。 如 学 习 速 率 太 大 ， 将 导致 其 误差 值 来 回 振荡 :学习 速率 太 小 ， 则 导致 术 小 的 动量 能 
显 ， 从 而 使 其 只 能 跳出 很 浅 的 “ 坑 兴 对 于 较 大 的 “ 坑 ” 或 “ 谷 ”将 无 能 为 方 。 而 从 另 一 
方面 米 看 ， 其 误差 相对 于 权 伍 的 曲线 《〈 负 ) 的 形状 与 凹凸 性 是 由 问题 的 本 身 决 定 的 ， 所 以 
竹 个 问题 都 是 不 相同 的 。 这 必然 对 学 习 速 率 的 选 拼 带 米 了 困难 。- 一 般 情况 下 只 能 采用 不 同 
的 学 习 速 率 进 行 对 比 〈 丰 型 值 取 0. 05)。 另 外 ， 对 于 这 种 网 络 的 训练 必须 给 予 足够 的 训练 
次 数 ， 以 使 其 训练 结果 为 最 后 稳定 到 最 小 值 时 得 到 的 结果 ， 而 不 是 得 到 一 个 正好 摆动 到 较 
大 误差 值 时 的 网 络 权 值 。 

此 训练 方法 也 存在 缺点 。 它 对 训练 的 初始 值 有 要 求 ， 必 须 使 其 值 在 误差 曲线 上 的 位 置 
所 处 误差 下 降 方向 与 误差 最 小 值 的 运动 方向 一 孜 。 如 果 初 始 误 差点 的 斜率 下 降 方 向 与 道 向 
最 小 苇 的 方向 背道而驰 , 则 附加 动 旺 法 失效 。 训 练 结果 将 同样 落 入 局 部 极 小 值 而 不 能 自拔 。 
初始 香 选 得 太 靠 近 局 部 极 小 值 时 也 不 行 ， 所 以 建议 多 用 儿 个 初始 值 先 粗略 训练 玉 次 以 找到 
合适 的 初始 位 置 。 另 外 ， 学 习 速 率 太 小 时 ， 网 络 也 没有 足 驶 的 能 量 跳 过 低 “ 谷 岂 











2.1.2 自 适 应 学 习 速 率 


对 于 一 个 特定 的 问题 ， 要 选择 适当 的 党 习 速率 不 是 一 件 容易 的 事情 。 通 常 是 任 经 验 或 
实验 获取 ,但 即使 这 样 ， 对 训练 开始 初期 功效 较 好 药学 习 速率 ,不 见得 对 后 来 的 训练 合 i 
为 了 解决 这 一 问题 ， 人 们 和 良 然 会 想到 使 网 络 在 训练 过 程 中 自动 调整 学 习 速率 。 通常 调节 学 
习 速 挛 的 准则 是 : 检查 权 全 的 修正 值 是 否 真 正 降低 了 误 美 沙 数 ， 如 果 确 实 如 此 ， 则 说 明 所 
选取 的 学 习 速 率 值 小 了 ， 可 以 对 其 增加 一 个 量 : 大 不 是 这 样 ， 而 产生 了 过 调 ， 那 么 就 应 该 
减 小 尝 习 速率 的 值 。 与 采用 附加 动量 法 时 的 判断 条 件 相 仿 ， 当 新 误差 超过 人 旧 误 差 . - 定 的 倍 
数 时 ， 学 习 速 率 将 减少 ;否则 其 学 习 速 率 保 持 不 变 : 当 新 误差 小 于 浊 误 差 时 ， 学 习 速率 将 
被 增加 。 此 方法 可 以 保证 网 络 总 是 以 最 大 的 可 接受 的 学 习 速 率 进行 训练 。 当 一 个 较 大 的 学 
习 速 率 仍 能 够 使 网 络 稳定 学 习 ， 使 其 误差 继续 下 降 ， 则 增加 学 习 速 率 ， 使 其 以 更 大 的 学 习 
速率 进行 学 习 。… 且 学 习 速 率 调 得 过 大 ， 而 不 能 保证 误差 继续 减少 ， 则 减少 学 习 速 率直 到 











使 其 学 习 过 程 稳定 方 止 。 下 式 给 出 了 一 种 自 适应 学 习 速 率 的 调整 公式 : 
.05 SSE0D < SS 瑟 估 下 
有 (大 十 耻 一 10.771( SS > 1.04.85 五 化- 个 (2.61 
了 (天 ) 其 他 


同样 ，SEE 为 网 络 条 出 误 莽 和 。 初 始 学 习 速 率 ?fm 的 选取 范围 可 以 有 很 大 的 随意 性 。 
实践 证 明 采 用 自 适 应 学 习 速 率 的 网 络 训 次 数 具 是 国定 学 习 速 率 网 络 训练 次 数 的 几 十 分 之 
一 。 所 以 具有 特 适 应 学 习 速 率 的 网 络 训练 是 极 有 效 的 训练 方法 。 

在 3BP 网 络 的 实际 设计 和 训练 中 ， 总 十 要 加 进 上 述 两 种 改进 方法 中 的 一 种 ， 或 两 种 同 
时 应用 ， 大 们 元 乎 不 再 采用 单纯 的 BP 算法 。 虽 然 这 些 改进 算法 有 共有 较 多 的 参数 变化 ， 促 
在 许多 常用 的 应 用 软件 包 中 ， 都 已 有 股 成 多 改 进 算 法 可 以 次 接 调用 ， 从 而 对 于 神经 网 络 的 
设计 者 来 说 ， 可 以 把 更 多 的 精力 用 到 掌握 和 了 解 更 多 和 和 轴 好 的 改进 算法 上 ， 以 选择 适当 的 
算法 粹 训练 网 络 . 

















2.1.3 阐 性 BP 算法 


BP 了 网 络 通 常 采 用 Sigmoid 隐 合 层 。Sigmoid 男 数 常 被 称 为 “ 压 扁 ” 函 数 ， 它 将 一 个 无 
限 的 得 入 范围 讨 缩 到 -- 个 有限 的 输出 范围 。 其 特点 是 当 输 入 很 大 时 ， 伴 率 接 近 0， 这 将 导 
致 算法 中 的 梯度 幅 值 很 小 ， 可 能 使 得 对 了 网络 权 值 的 修正 过 程 几乎 停 蚌 下 来 。 

弹性 BP 算法 只 取 仿 导数 的 符号 ， 而 不 考虑 偏 导数 的 帆 值 。 偏 导数 的 符号 决定 权 值 不 
新 的 万 向 ， 而 权 值 变化 的 大 小 出 一 个 独立 的 “更 新 值 ” 确 定 。 车 在 两 次 连续 的 欠 代 中 ， 目 
标 画 数 对 基 个 权 值 的 偏 导数 的 符 导 不 变 号 ， 则 增 大 相应 的 “点 新 值 ”( 如 在 前 一 次 “更 新 
值 ”的 基础 上 乘 1.3)》 车 变 号 ， 则 减 小 相应 的 “更新 值 ”( 如 在 前 一 次 “更 新 侦 ” 的 基础 
上 乘 0.5?。 其 权 合 修正 的 偿 代 过 程 可 表示 如 下 : 

和 全 1 一 和 外 一 内 系 届 ) *SignftV 太 司 ) (2.7) 

其 中 ，AK 人 为 前 一 次 的 “更 新 值 ”， 其 初始 值 AX 必 要 根据 实际 应 用 预先 设 定 。 

在 弹性 BP 党 法 中 ， 当 训练 发 后 振荡 时 ， 权 值 的 变化 盟 将 减 小 ， 当 在 几 次 适 代 过 程 中 
权 征 秃 戎 一 个 方向 变化 时 ， 权 什 的 变化 量 将 载 大 ， 因 此 ， 一 般 来 说 ， 弹 性 BP 算法 的 收 仇 
速度 查 比 前 述 几 种 方 尘 快 得 多 。 而 且 算 法 并 不 复杂 ， 也 不 需要 消耗 更 多 的 内 存 。 

以 上 三 种 改进 算法 的 存储 明 要 求 相差 不 大 ， 徊 算法 的 收敛 速度 依次 加 忆 。 其 中 ， 弹 性 
BP 算法 的 收 伍 速度 远 快 于 前 两 首 。 大 量 实际 应 用 已 证 明 弹 性 BP 算法 非常 有 效 。 

因此 ， 在 实际 应 用 的 阅 络 训练 申 ， 当 采用 附加 动量 法 万 至 可 变 学 习 速 率 的 BP 氏 法 达 
不 到 训练 要 求 时 ， 可 以 采用 弹性 BP 算法 或 下 而 介绍 的 基于 数值 优化 的 方法 。 








2.2 基于 数值 优化 方法 的 网 络 训练 算法 





上 一 节 所 介绍 的 几 种 基于 一 阶梯 度 的 方法 用 于 简单 问题 时 往往 可 以 很 侠 地 收 就 到 期 户 


值 ， 然 而 ， 妆 用 计较 复 执 的 实际 问题 时 ， 除 了 弹性 BP 黎 法 以 外 ， 其 余 算 法 在 收 敏 速度 上 
邦 存 在 肴 一定 的 问题 。 

BP 网 络 的 训练 实质 上 是 -个 非 歧 性 日 标 函 数 的 优化 问题 ， 大 们 对 非 线性 优化 问题 的 
研究 已 有 数 吝 年 的 历 只 ， 而 且 ， 不 少 传统 数值 优化 方法 收 和 化 也 较 快 。 因 而 ， 人 们 自然 想到 
采用 基 十 数值 优化 方法 的 答 法 对 BP 网 络 的 权 值 进行 训练 。 与 樟 度 下 降 法 不 骨 ， 基 于 数值 
优化 的 咎 法 不 仅 利 用 了 目标 函数 的 一 阶 导数 信息 ， 往 往 还 利用 日 标 函 数 的 二 阶 导 数 信 息 。 
这 尖 算 法 ， 包 搬 氢 牛顿 法 、Levenberg-Marquardt 法 和 共 箔 梯度 法 ， 它 们 本 以 统一 描述 为 : 

JED)=min FOX + 有 全 S( 和 人 
寻 【2.8) 
和 tbD 一 着 全 ) (8S( 生 直方 

其 中 ，X (9 为 网 络 所 有 的 权 值 和 含 置 值 组 成 的 向 明 ，sS(XG)) 为 由 半 的 各 分 量 组 成 
的 向 星空 间 中 的 搜索 方向 ，m7 GO 为 在 SCX 的 ) 的 方向 上 ， 使 FX 人 StD) 达到 极 小 的 步 长 。 
这 样 ， 网 络 权 值 的 寻 优 分 为 两 省 ， 首先， 确定 当前 迁 代 的 最 佳 搜索 方 向 SC 如) ， 而 后 ， 
在 此 方向 上 寻求 最 优 送 代步 长 。 关 于 最 优 搜索 步 长 ?如 的 选取 ,是 一 个 一 维 搜索 《 线 搜 索 ) 
问题 。 对 这 一 问题 有 许多 方法 可 供 选择 ， 如 黄金 分 割 法 、 二 分 法 、 多 项 式 插 值 、 回 淹 法 等 。 
以 下 所 讨论 的 三 种 方法 的 区 别 正 在 于 对 最 佳 搜索 方向 8(CX t)) 的 选择 上 有 所 不 同 。 












































2.2.1 拟 和 牛顿 法 


牛顿 法 是 一 种 常见 的 快速 优化 方法 ， 它 利用 了 一 阶 和 二 阶 导数 信息 ， 其 基本 形式 是 ; 
第 -次 选 代 的 搜索 方向 确定 为 负 梯度 方向 ， 即 搜索 方向 SCX(OD)-_VYrtx(O) ， 以 后 
各 次 迭代 的 搜索 方向 由 下 式 傅 定 : 
SC 外 = 一 ( 电 ()1VFCE 做 ) (2.9 1 
即 


和 CHD 一 基 的 -DSS 和 井 人 (用人 9)-1VF( 和 人 ) (2 10) 


其 由 ， 4 为 海 森 《Hessian》 珑 阵 〈_- 阶 导数 矩阵 )。 和 牛顿 法 的 收敛 速度 比 -阶梯 度 
法 快 ， 不 过 山 于 神经 网 络 中 参数 数目 的 应 大 ， 导 致 计算 海 森 矩 阵 的 复杂 性 增加 。 
因此 ， 人 们 在 牛顿 法 的 基础 上 ， 提 出 了 一 类 无 需 计 算 二 阶 导 数 和 矩阵 及 其 求 道 运算 的 方 
法 。 这 类 方法 一 般 是 利用 梯度 信息 或 一 个 近似 矩阵 去 时 近 ak&)。 不 同 的 构造 后 扣 的 方法 ， 
战 产 生 了 不 同 的 拟 午 顿 法 。 显 然 ， 拟 牛顿 法 十 为 了 克服 梯度 下 降 法 收 敏 慢 以 及 牛顿 法 计 代 
复杂 而 提出 的 一 入 算 法 。 下 而 ， 介 绍 两 种 比较 由 型 的 拟 牛 顿 法 ， BFGS 拟 牛 顿 法 和 正 割 拟 
牛 恩 法 。 

1) BRFGS 所 牛顿 法 

除了 第 一 次 选 代 外 ， 对 应 (29)、(2.10) 两 式 ，BFGS 抽 午 顿 法 在 每 一 次 选 代 中 采用 
下 式 来 台 近 海 森 矩阵 ， 
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VfCKCD)*YICXC 7 deXK*qdgX7 


(FF 一 
囊 “= 殖 十 VFCKGTDJ7T SLCD) dgXTaTE-DS(X CD) 


{2.112 





其 中 ，degX = VF( 匡 的 ) 一 YF(LD) 

BFGS 拟 牛 顿 法 在 每 次 迭代 中 都 要 存储 近似 的 海 森 和 矩阵， 海 森 矩 阵 是 一 个 *a 的 矩 
阵 ， 中 是 网 络 中 所 有 的 权 值 和 偏 置 的 总 数 。 因 此 ， 当 网 络 参数 很 多 时 ， 要 求 极 大 的 存储 重 ， 
计算 也 较为 复杂 。 

2) 正 害 拟 牛 顿 法 

正 草 拟 牛 琐 入 不 需要 仓储 完整 的 海 森 矩阵 ， 除 了 第 一 次 迭代 外 ， 以 后 各 次 迭代 的 搜索 
方向 由 下 式 确定 

8( 瑟 各) 一 一 WP 和 全 十 疝 四 CS 作坊 ) 十 吾 . deX 《2.12 1) 

其 中 


dgX = VPCX LO ) 一 VF(Z CD) 


8( 站 你 站) 可 WF( 夺 人 ) 
至 .= 一 一 一 一 一 一 一 一 -一 
SO)T*dgXK 


Ts 了 床 () 
4 =j1+ 一 4 4 |*B + VC ) 
SCKCG-DJT sdeX SOKCEDT ydeX 
相对 于 BFGS 拟 牛 顿 法 ， 正 割 拟 牛 恩 法 碱 小 了 存储 量 与 计算 量 。 实 际 上 ， 正 割 拟 牛 顿 
法 是 通 第 的 需要 近似 计算 海 森 矩 阵 的 拟 牛 顿 法 与 后 面 要 介绍 的 共 斩 梯 度 法 的 一 种 折衷 ， 它 
的 形式 与 共 斩 梯 度 法 相似 。 


2. 2. 2 共 斩 梯 度 法 


鉴于 梯度 下 降 法 收 敏 速度 慢 ， 而 拟 牛 顿 法 计算 较 复杂 ， 共 辆 梯度 法 力图 避免 两 者 的 缺 
点 。 共 入 梯 度 法 的 第 一 步 沿 负 梯 度 方向 进行 搜索 ， 然 后 沿 当前 搜索 方向 的 花 方向 进行 搜 
索 ， 可 以 迅速 达到 最 优 值 。 其 过 程 描述 如 下 : 

第 一 次 帮 代 的 搜索 方向 确定 为 负 梯度 方向 ， 即 搜索 方向 8(X 人 外)= -VF(X 池 ) ， 以 后 
各 次 友 代 的 搜索 方向 由 下 式 确定 : 


SGXOO)=-YFCXOD)+BODSCKCLD) (2.13 ) 


其 中， 居 风 一 时 ( 十 用 全 1S(X 克 ) 。 





根 掺 84) 所 取 形 式 的 不 同 ， 可 构成 不 同 的 共 斩 梯 度 法 。 常 用 的 两 种 形式 是 : 
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工 T 
虽 8E8 of) AS-1SK 
有 = 一 或 8 = 一 一 
工 


二 《3.147 
KK-18K-i 有 -1 


其 中 ，Bgkg =VFGCX IO )。 

通常 ， 搜 索 方向 S(Z 009) 在 选 代 过 程 中 以 一 定 的 周期 复位 到 负 梯 度 方 向 ， 周 期 一 般 为 
于 《网 络 中 所 有 的 权 值 和 偏 美 的 总 数 日 )- 

共 弓 度 法 比 绝 大 多 数 常 规 的 梯 应 下 降 法 收 敏 都 要 快 ， 而 且 只 需 增 加 很 少 的 存储 攻 
计算 量 ， 因 而 ， 对 于 权 值 很 党 的 网 络 采 用 共 斩 梯度 法 不 失 为 一 个 较 好 的 远 择 。 





2.2.3 Levenberg-Marquardt 法 


Levenberg-Marguardt 法 实际 上 是 梯度 让 降 法 和 牛 球 法 的 结合 。 我 们 知道 ， 梯 度 下 降 
法 在 开始 几 步 下 降 较 快 ， 伍 随 者 接近 最 优 介 时， 出 于 梯度 艳 于 零 ， 使 得 日 标 请 数 下 降 组 袖 ; 
而 咎 瑟 法 可 以 在 最 优 和 但 附近 产生 一 个 理想 的 搜索 方向 。Levenbcrg-Marquardt 法 的 搜索 方 
人 向 定 为 : 





(区 = 一 (百代 十 和 本 站 VPCOX 志方 (2.13 7 


念 T =1， 则 六 全 1 一 基 人 二 全) 。 


起 始 时 ，4 到 : 企 很 大 的 数 〈 如 104 》， 此 时 相当 于 步 长 很 小 的 梯度 下 降 法 ， 随 兰 最 
优点 的 接近 ，4 诚 小 到 零 ， 则 SCXgO) 从 负 梯度 方向 转向 生 顿 法 的 方向 。 道 常 ， 妆 
人 DJ< FOX ， 沽 小 1 【 间 MHD =051 3) 否则， 增 大 入 〔 如 AHD 24 )。 

从 《2.15) 起 中 可 以 注意 到 该 方法 仍然 需要 求 海 森 和 矩阵。 不过，1i6 于 在 训练 BP 网 络 

叫 日 标 羡 数 背 管 上 共有 半 方 和 的 形式 “这 也 大 该 算法 最 初 所 要 解决 的 问题 》， 则 潍 森 矩阵 可 





通过 雅 可 比 《Jacobian》 矩 阵 进行 近似 计算 万 = ， 雅 可 比 定 阵 包 含 网 络 误差 对 权 仁 及 
傈 差 的 一 阶 导 数 ， 而 道 过 标 浊 的 反 回 导播 技术 计算 雅 可 比 第 阵 要 比 计 算 海 森 玫 阵 容易 得 
多 。 

Levenberg-Marquardt 须要 的 存储 蝶 银 大 ， 由 为 苦 可 毕 短 阵 使 用 一 个 &*n 斌 阵 ， 恕 是 
训练 样本 的 个 数 ， 关 是 网 络 中 所 有 的 权 值 和 偏 盖 的 总 数 明 。 为 批 ， 也 产生 了 其 他 .一 些 用 以 
降低 内 存 的 Levenberg-Marquardt 法 。 

TeVenbeT Marquardt 的 长 处 是 在 网 络 权 伸 数 日 较 少 时 收 伍 非常 迅 

条 上 上 所 壕 ， 显 然 ， re Marquardt 法 和 氢 和 后 畅 法 因为 要 近似 计算 海 森 外 阵 ， 需 
要 较 大 的 存 依 划 ， 不 过 ， 通 常 这 两 类 方法 的 收 伍 速度 较 快 。 甚 中 ，Levenberg-Marquardt 
法 结合 了 梯度 下 降 法 和 牛顿 法 的 优点 ， 性 能 更 如 优良 … 些 。 共 生 梯 度 法 所 需 仓 依 基 较 小 ， 
但 骆 伍 速度 可 对 前 帅 种 方法 慢 。 所 以 ， 考 虑 到 网 络 参数 的 数 踢 《 即 网 络 中 所 有 的 权 什 和 偏 
在 的 总 数 帖 )， 在 村 择 名 法 对 网 络 进行 训练 时 ， 可 以 遵 题 以 下 原则 : 
避 在 网 络 参 数 很 少时 ， 可 以 使 用 牛顿 法 或 Levenpberg-Marquardt 法 ， 








的 在 网 络 参 数 适 中 时 ， 可 以 使 用 拟 牛 顿 法 ， 

抱 在 网 络 参数 很 和 多， 需要 考虑 到 存储 容量 问题 时 ， 不 妨 选 拌 共 斩 李 度 法 。 

其 实 ， 对 于 不 加 的 问题 ， 很 难 比 较 算 法 的 优 笋 。 而 对 于 特定 问题 ， 一 种 遂 冲 较 好 的 方 
法 有 时 却 可 能 不 易 获 得 并 好 的 训练 葡 果 ,其 全 可 能 出 现 难 于 收敛 到 也 定 日 标的 情 风 : 因此 ， 
在 解决 实际 问题 时 ， 应 当 尝 试 采 用 多 种 不 同类 型 的 训练 算法 ， 雯 期 获得 满意 的 纺 凡 。 在 大 
和 多数 司 况 下 ， 吕 以 合用 Levenberg-yarquardt 法 和 拟 和 牛顿 法 ， 此 外 ， 弹 忻 呈 氏 和 法 也 是- 
种 简单 有 效 的 方法 。 

需 此 指出 的 号， 本章 述 及 的 所 有 算法 均 存 在 后 部 极 小 问题 ， 如 经 验 而 林 ， 对 大 多 数 亲 
题 ，Levenberg-yMarduardt 法 可 以 获得 机 对 较 好 的 结果 ， 然 而 这 一 结论 漫 有 仁和 何 理 论 依 殷 ， 
所 以 对 拓 络 座 妆 使 用 不 同 的 初始 舍 进 行 多 次 的 训练 。 此 外 ， 当 然 还 可 以 采用 其 他 全 局 优化 
算法 ， 旭 横 所 退 火 法 、 壮 传 算法 等 ， 米 解决 局 齿 概 小 问题 。 


























2.3 数值 实例 对 比 


本 闻 将 对 上 述 的 所 右 算 法 的 实际 应 用 效果 进行 多 和 值 实验 对 比分 析 : 虽然 有 些 算 法 的 实 
现 较为 复杂 , 不 过 在 计算 机 软件 的 辅助 下 已 经 不 成 问题 , 尤 共 在 探 删 界 常用 的 MATLAB 5.3 
的 祁 经 网 络 工 具 箱 中 ， 己 有 实现 上 述 训练 算法 的 责 数 ， 谱 计 者 只 需 进 行 陡 党 的 调用 即 二 对 
网 络 进 行 训练 。 

中 将 给 出 两 个 例子 ， 均 在 MATLAB 5.3 环境 下 进行 。 第 -个 例子 为 利用 神经 网 
络 的 非 线 尾 过 近 的 特性 对 “个 非 线性 函 煞 对 象 进行 逼近 ;， 第 二 个 例子 是 利用 神经 网 络 对 一 
个 真实 的 非 线性 直流 电机 进行 建 模 。 











2.3.1 非 线性 函数 的 逼近 


构造 目 线 性 函数 对 银 : 


的 =yG-Dsy2C-Dhesk-b (2.16 
训练 用 输入 信和 号 取 为 : 
化)}= 0.2sinf2 艳 125)+0.3sinfzk715jH03sinfzk 7175) (2.17) 


将 信号 (2.17》 式 作 为 非 线 性 测 香 〈2.16) 式 的 输入 们 号 ， 取 大 从 0 到 200 的 输入 /和 输 
出 作为 训练 样本 ， 网 络 沂 练 样本 的 输入 /输出 关系 如 岁 2.1 所 示 ， 

在 MATLABE 5.3 中 ， 如 果 查 个 网 络 完成 某 种 功能 ， 设 让 者 可 以 通过 油 用 冰 数 new 全 
实 再 网 络 的 创建 ， 然 后 再 调用 畏 数 train 对 所 建 网 络 new 任 进行 训练 . 

冰 数 new 允 带 有 四 个 参数 :对 于 一 个 输入 节点 数 为 员 的 网 络 ， 第 -个 参数 是 -个 届 *2 
的 算 阵 ， 基 中， 第 了 行 的 两 个 元 素 优 次 为 所 有 有 输入 样本 中 对 应 于 第 庆 个 输入 的 最 小 护 最 太 
泡 围 第 :个 参数 是 一 个 给 出 各 大 神经 天 个 数 的 数组 : 第 三 个 参数 是 各 层 采 用 的 激活 函数 
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的 名 称 ;， 第 四 个 输入 参数 是 所 选用 的 网 络 训练 算法 的 名 称 。newff 的 返回 值 是 一 个 经 过 初 
始 化 后 的 网 络 对 象 。 本 例 中 ， 用 于 对 非 线性 函数 的 逼近 的 网 络 可 创建 如 下 : 


0.5 
三 0 

-0.5 

-1 | 

-1 -站 .5 心 站 .S T 

输入 
图 2. 1 输入 /输出 关 么 曲线 图 

疡 = 区] (2.18) 


net 三 new 仁 (mimmaxfp)t5， 了 | tansig'， purelin 和 traingd') 


在 神经 网 络 工具 箱 中 ， 前 述 各 种 训练 算法 已 经 编制 成 血 文件 ， 设 计 者 只 要 在 newff 
的 第 四 个 参数 中 选用 希望 采用 的 算法 名 称 ， 如 可 调用 函数 train 进行 网 络 的 训练 。 函 数 
train 有 三 个 参数 : 第 一 个 参数 是 由 newff 创建 的 网 络 ， 第 二 个 参数 是 输入 矩阵 ， 第 三 个 
参数 是 期 望 输 出 窍 阵 ， 


net 一 trainfnety) 《2.19) 


在 〈2.18)、(2.19) 式 中 ， 下 为 所 有 200 个 样本 输入 组 成 的 行 向 量 ，y 2 为 200 个 样本 
和 输出》 经 一 阶 延 时 组 成 的 行 向 量 。 即 网 络 的 输入 向 量 有 两 个 , 与 凤 ， 它 们 组 成 输入 矩 
阵 P， 网 络 的 期 望 输 出 为 了 〔200 个 样本 输出 组 成 的 行 向 量 )。Minmax(p) 意 为 取得 输入 疝 
量 的 最 小 到 最 大 的 范围 ; 网 络 的 第 一 层 〈 即 隐 含 层 ) 包含 有 五 个 节点 ， 第 二 层 〔“ 即 输出 层 ) 
包含 有 一 个 节点 。 隐 含 层 采用 tan-Sigmoid 函数 ;输出 屋 采 用 线性 函数 purelin。 所 选 训练 
算法 traingd 为 标准 的 梯度 下 降 法 。 

作为 对 比 ， 我 们 始终 采用 (2.18) 式 中 的 网 络 结 构 ， 而 只 改变 最 后 的 算法 参数 ， 采 用 
《2.19) 式 对 网 络 进行 训练 ， 以 此 来 观察 各 种 训练 算法 的 收敛 速度 。 

值得 注意 的 是 ， 开 始 训练 之 前 ， 必 须 对 网 络 的 权 值 与 偏差 进行 初始 化 。 好 在 函数 new 任 
自动 调用 人 缺 省 ， 这 只 是 一 种 初始 化 方法 。 

我 们 把 标准 梯度 下 降 法 、 附 加 动量 的 BE 算法、 学 习 速 率 可 变 的 BP 算 法 放 在 一 起 进行 
比较 。 训 练 中 ， 以 固定 最 大 迭代 次 数 20000 为 标准 。 网 络 的 初始 化 采用 Nguyen 与 叶 drow 提 
册 的 名 为 initnw 的 初始 化 函数 ， 它 可 以 使 每 一 良 神 经 元 的 激活 区 域 大 致 上 均匀 分 布 在 输入 
空间 上 。 考 虑 到 每 次 对 网 络 的 权 值 与 偏 轩 值 的 初始 化 结果 不 完全 相同 ， 因 此 对 每 种 算法 应 
进行 多 次 训练 ， 表 2. 1 给 出 了 三 种 算法 收敛 速度 的 比较 。 表 中 的 数据 均 为 五 次 训练 的 平均 
值 。 

铀 表 2. 1 可 见 ， 三 种 方法 所 用 时 间 都 在 400 秒 以 上 ， 不 过 ， 在 误差 的 变化 上 ， 学 习 速 率 
可 变 的 印 算法 的 收 伍 速度 明显 比 前 两 种 恢 ， 它 达到 了 0. 0001 的 数量 级 。 
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表 2. 1 三 种 算法 收 化 速度 的 比较 


函数 算 活 描述 是 问 ( 和 7 
traingda 变 学 习 速 率 的 Bp 符 法 


附加 动 捍 的 BP 算 法 ， 动 量 思 子 nc-0.9 
标准 梯度 下 降 法 (标准 了 算法 ) 


监 于 强 性 BP 算 法 及 基于 数值 优化 的 算法 收 伍 速 度 很 快 , 可 用 辐 定 上 日 标 函 数 ( 均 方 误 基 ) 
595 = 0. 00001 来 进行 性 能 的 对 比 实 验 ， 使 各 算法 一 直选 代 到 满足 日 标 要 求 才 停 中 。 矿 次 
成 功 训 练 的 平均 值 记 录 如 表 2. 2 所 示 。 表 中 给 出 了 MATLAB 5.3 中 所 有 的 有 四 种 不 同 的 共 斩 
梯度 法 和 两 种 不 同 的 所 牛顿 法 的 训练 结果 。 































闻 ， 还 是 在 收 和 化 精度 上 ， 都 有 着 绝对 的 优势 ， 两 者 不 在 同一 个 数 基 级 上 。 由 此 可 见 ， 在 标 
准 梯度 下 降 法 基础 上 进行 改进 的 算法 , 所 取得 的 进步 是 很 有 有 限 的 。 上 归 想 有 数量 级 上 的 突破 ， 
必须 转变 思路 。 基 于 数值 优化 的 方法 就 症 一 个 极 好 的 尝试 。 我 们 应 攻 在 今后 的 研究 与 应 用 
中 ， 采 用 这 些 现成 的 软件 编制 好 的 训练 网 络 的 算法 ， 以 提高 网 络 设计 的 精度 ， 有 灵活 地 应 用 
于 实际 问题 中 。 








表 2. 2 快速 训练 算法 的 收敛 速度 对 比 


Fleteher-Powell 共 匈 梯度 法 ， 
trainegf 6 有 ]44. 34 二 这 
-一 上 一 
ET8K 一 1 
3 Ag7 8 
Polak-Ribiere 共 筑 梯 度 法 ， 其 巾 jp 全 ) -一 此- 
十 工 羡 1 瑟 亡 呈 让 了 


i 8 8 一 
Powell-Beale 共 倒 梯 度 法 ， 当 前 梯度 与 前 一 梯 应 正 
交 性 和 根 小 时 ， 将 搜索 方向 复位 到 负 梯 度 方向 


2. 3. 2 逼近 非 线性 直流 电机 的 输入 /输出 特性 






























下 而 ， 将 再 对 一个 实际 存在 的 具有 非 线性 摩擦 力 影 响 的 直流 电机 的 给 入 /输出 特性 进 
行 神经 网 络 建 异 ， 并 采用 不 同 的 训练 算法 进行 对 比 。 用 来 采集 答 入 /输出 位 中 的 实际 控制 
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系统 包括 一 台 Pentium 200 计算 机 、 一 块 内 管 于 计算 机 的 12 位 AZD，DAA 转换 板 、PWW 功 
率 放 大 电路 、 次 流 力 托 电动 机 发 用 于 速度 反馈 的 直流 淹 速 发 电机 。 模 拟 电 压 输入 范围 与 答 
出 控制 电压 范围 均 为 [-5, 5] 伏 ， 模 数 转 换 后 的 数字 量 范 围 均 为 [-2048, 20481， 为 了 方便 起 
见 ， 输 入 和 输出 单位 均 采 用 数字 苦 。 被 拧 系 统 的 借 型 包括 除 计算 机 外 的 所 有 部 件 的 集合 ， 

给 电机 系统 输入 幅 值 为 300， 周 期 为 10s 的 正弦 信号 ， 在 5ms 的 采样 周期 下 ， 获 得 电 
机 的 真实 输出 《〈 即 转速 信号 )。 实 际 电机 的 输入 /输出 如 图 2.2 所 示 。 从 中 可 见 系统 中 存在 
着 产生 的 非 线性 特性 。 

实验 表明 ， 采 用 标准 梯度 下 降 法 、 附 加 动量 的 阳 算法 、 学 习 速 率 可 变 的 了 算法 米 训 
练 网 络 模型 ， 无 法 达到 性 能 日 标 。 我 们 曾 采 用 可 变 学 习 速 率 的 卫 算法 订 练 了 3 个 小 时 ， 
训练 的 误差 仍然 离 上 日 标 相 差 很 还 。 

假设 电机 模型 为 一 阶 系统 ， 即 输入 /输出 关系 式 可 以 表示 为 

GOJ= FFO 代 -ak- 芭 《2. 20) 
那 冬 我 们 仍然 可 用 上 例 中 的 网 络 结构 newff 来 训练 网 络 模型 ， 训 练 集 样本 煞 为 2000 


个 。 





400 


输出 〈 数 字 量 
局 


-400 -200 0 200 400 
输入 《数字 景 ) 
图 2.2 实际 电机 输入 /输出 关系 图 

经 过 多 次 实验 ， 除 trainscg 共 加 梯 度 法 外 ， 其 余 三 种 共 物 梯度 法 均 在 离 目标 较 远 的 
点 陷入 局 部 极 小 值 ， 使 得 线 搜索 步 长 趋 近 于 零 而 终止 训练 。trainscg 法 锚 然 没有 陷入 局 
部 极 小 值 ， 但 收 和 化 也 很 慢 。 曾 经 进行 了 100000 次 选 代 ， 耗 时 近 三 个 小 时 ， 均 方 误 差 S55 
才 达 到 22. 8295( 考 虑 到 输出 信 身 的 幅 值 ,这 个 结果 勉强 可 以 接受 )。 拟 牛 赖 法 中 的 trainoss 
法 收 各 速度 也 很 慢 ， 根 本 无 法 实用 。 

最 后 ， 只 有 表 2. 3 中 的 三 种 方法 ， 在 固定 目标 函数 【 均 方 误 养 ) 为 SS = 2 的 条 件 下 ， 
可 以 使 迁 代 ~- 直 进 行 到 满足 目标 要 求 为 止 。 

表 2.3 三 种 算法 的 比较 











出 此 可 见 ， 在 实际 应用 中 ， 要 针对 兵 体 的 问题 党 试 多 种 算法 来 训练 网 络 ， 以 达到 最 佳 


效果 。 另 外 ， 从 两 个 例子 中 可 以 看 出 ，BEGS 拟 牛顿 法 和 Levenberg-Marquardt 法 两 种 算法 
均 有 上 乘 表 现 ， 其 中 ， 后 者 的 收敛 速度 最 快 ， 在 相同 的 误差 目标 下 所 花费 的 时 间 之 短 ， 是 
共 他 大 多 数 算法 所 无 法 比拟 的 。 





2.4 小 结 


本 章 对 几 种 训练 BP 网 络 权 值 的 改进 算法 进行 了 性 能 上 的 分 析 和 对 比 。 通 过 对 实验 纺 
果 的 对 比分 析 表 上 明 ， 采 用 基于 标准 数值 优化 方法 的 各 种 改进 算法 要 比 基 于 标准 梯度 下 降 法 
的 改进 算法 在 收 伍 速 度 上 有 着 一 个 数量 级 以 上 的 提高 。 这 为 采用 神经 网 络 对 复杂 系统 进行 
建 模 与 控制 提供 了 亲 行 性 。 不 过 ， 这 里 所 讨论 的 算法 均 在 在 隐 入 局 部 极 小 值 的 可 能 性 。 这 
一 铭 题 可 以 通过 其 他 途径 加 以 解决 。 
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第 3 章 Bp 网 络 在 智能 系统 中 的 建 模 与 控制 


人 工 神经 网 络 已 在 各 个 领域 得 到 广泛 的 应 用 ， 尤 其 是 在 智能 系统 中 的 非 线性 建 模 及 其 
控制 器 的 设计 、 模 式 分 类 与 模式 识别 、 联 想 记 忆 和 优化 计算 等 方面 更 是 得 到 人 们 的 极 大 关 
注 。 从 控制 理论 的 观点 来 看 ， 神 经 网 络 对 非 线性 函数 的 遮 近 能 力 是 最 有 意义 的 ， 因 为 非 线 
性 系统 的 变化 多 端 是 采用 常规 方法 无 法 建 模 和 控制 的 基本 原因 ， 而 神经 网 络 描述 非 线性 图 
形 的 能 力 ， 也 就 是 对 非 线性 系统 的 建 模 能 力 ， 正 适合 于 解决 非 线性 系统 建 模 与 控制 器 综合 
中 的 这 些 问题 。 具 有 这 一 特性 的 前 向 芭 向 传播 网 络 在 实际 应 用 中 的 比例 要 占 所 有 人 工 神经 
两 络 应 用 的 80 华 以 上 。 所 以 下 面 从 BP 网 络 入 手 ， 介 绍 BP 网 络 在 控制 系统 中 的 非 线 性 建 
模 、 控 制 器 设计 以 及 多 种 常用 的 系统 控制 方案 。 

虽然 人 工 神经 网 络 的 种 类 已 多 达 上 百 种 ， 但 应 用 最 多 的 还 是 BP 网 络 。 不 过 BP 网 络 
所 具有 的 基本 功能 只 有 一 个 ， 那 就 是 非 线性 连续 有 理 函 数 的 遏 近 功能 。 对 控制 系统 中 的 非 
线性 过 程 的 建 模 以 及 对 系统 的 控制 器 的 设计 也 是 利用 BP 网 络 这 一 基本 的 功能 。 


3.1 直接 正 向 模型 建立 


假定 〈 被 控 ) 系统 离散 型 非 线性 差分 方程 为 
了 人 十 人 = 70 并 yp 做 一 有 TCD ea 人 (天 -六 +D) (3.1) 
即 由 非 线性 函数 了 所 确定 的 系统 ， 在 大 + 1 时 刻 的 输出 取决 于 过 去 个 时 刻 的 输出 值 ， 
以 及 过 去 严 个 时 刻 的 输入 值 。 





加 


( 
M 


学 习 规则 
图 3, 1 网 络 建 模 训 练 时 结构 图 

这 里 我 们 关心 的 是 系统 响应 的 动态 部 分 ， 模 型 对 系统 干扰 的 表达 式 是 隐 售 在 其 小 的 ， 

那么 对 系统 建 模 的 一 个 直接 的 方法 是 通过 选择 与 系统 相同 的 输入 /输出 数据 作为 训练 
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用 样本 ， 对 神经 网 络 进行 训练 ， 其 日 的 是 为 了 使 网 络 的 输入 / 输 则 能够 与 系统 的 输入 /输出 
完全 一 致 。 知 取 网 络 的 输出 变量 为 加， 那么 训练 网 络 时 的 网 络 结构 图 应 如 网 3.1 所 示 。 

根据 图 3.1 所 示 的 网 络 建 模 训练 图 可 以 写 出 网 络 输入 与 输出 之 问 的 关系 式 为 : 

Jr 人 优 直 = 了 0p(syp 估 一 Tsa(E 一 严 十 切 {3.2 

此 处 ， 了 代表 网 络 的 非 线性 笨 入 /输出 呐 照 关系 〈 即 为 函数 广 的 下 近 )。 注 意 训练 中 的 
网 络 输入 包括 真实 系统 过 去 时 刻 的 输出 值 〈 作 为 样本 输入 的 一 部 分 )， 不 过 此 时 网 络 没 有 
一” 估 定 网 络 在 经 过 透 当 的 训 维 过 程 厅 得 到 了 满意 的 函数 拟 合 《 部 获得 ym = yp )， 那 
人 笃 网 络 的 训练 则 完成 ， 并 在 网 络 以 后 的 工作 中 ， 可 以 将 网 络 自身 的 输出 反馈 回来 作为 网 络 
输入 的 一 部 分 ， 以 这 种 方法 使 网 络 能 够 独立 的 使 用 ， 如 图 3.2 所 示 。 











匀 3.2 网 络 模型 使 用 时 嫩 构图 
出 图 3.2 可 以 得 到 网 络 模型 的 输入 /输出 关系 式 为 : 


四 优 += 六 yy 人 优 一 站 Da 人 sa 一 丙 1) (3.3) 


山 于 系统 建 模 的 需要 ， 网 络 在 结构 上 将 其 输出 经 过 延 时 ， 作 为 网 络 和 输入 的 一 部 分 。 所 
以 ， 控 制 系统 中 用 于 建 模 的 网 络 可 以 被 称 为 “ 带 有 反馈 变量 的 前 向 网 络 ” 它 与 霍 普 菲 尔 
德 型 的 反馈 网 络 仍然 是 两 种 截然 不 同 的 网 络 。 


3.2 逆 模型 建立 


采用 非 线 性 系统 的 北 模 型 与 系统 本 身 相 串联 而 消除 其 非 线性 影响 的 岂 想 ， 促 使 人 们 感 
兴趣 对 逆 柜 垄 的 建立 。 人 们 最 容易 想到 的 利用 神经 网 络 建立 道 模型 的 方法 则 是 将 〈 被 控 》 
系统 的 输入 和 输出 数据 分 别 作为 网 络 的 输出 和 输入 来 训练 网 络 获得 。 即 所 谓 的 直接 逆 模 型 
建立 ， 其 网 络 的 训练 用 结构 图 如 图 3.3 所 示 。 从 图 中 可 以 看 出 ， 与 直接 建 模 一 样 ， 网 络 的 
输入 利用 了 系统 输入 /输出 的 综合 信息 ， 网 络 训练 采用 系统 输入 信号 与 网 络 输 出 信号 的 误 
差 来 修正 网 络 权 值 。 从 这 个 训练 网 络 的 结构 上 还 可 以 看 出 ， 训 练 网 络 的 目的 是 追 使 网 络 作 
为 系统 的 道 异 型 。 但 是 ， 这 种 方法 存在 着 缺陷 ， 首 先 ， 网 络 权 估 的 修正 过 程 不 是 采用 期 音 
的 样本 进行 学 习 训 练 的 。 训 练 赣 模 型 所 用 的 输入 信和 号 起 码 应 当 遍 及 控制 器 可 能 输入 的 所 有 
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范围 。 但 实际 济 练 时 所 采用 的 样本 不 可 能 被 事先 定义 。 另 外 ， 控 制 系统 的 实际 目标 是 希望 
通过 控制 器 的 行为 产后 期 望 的 系统 和 输出， 而 刘 练 赣 模 型 时 所 产生 的 系统 输出 也 并 不 是 期 户 
的 系统 输出 。 所 以 ， 在 直接 着 建 模 中 所 采用 的 训练 样本 并 不 与 所 需要 的 训练 样本 相对 应 ， 
因而 必然 有 可 能 任 在 未 被 训练 到 的 控制 域 。 其 次 ， 如 果 该 非 线性 系统 的 映 照 关系 不 是 一 一 
对 应 ， 那 么 ， 可 能 产 牛 一 个 不 正确 的 逆 模 型 。 实 际 应 用 中 人 常 被 人 采 有 而 的 建立 迹 模型 的 方法 
是 能 够 克服 上 述 缺 点 的 第 二 种 方法 ， 可 以 被 称 为 间接 逆 模型 训练 法 。 在 此 训练 方法 中 ， 网 
络 六 模型 被 置 于 〈 被 控 ) 系统 的 前 端 ， 并 月 将 网 络 的 输出 作为 系统 的 输入， 如 图 3.4 所 不。 





网 3.4 间接 赣 烧 型 训练 图 
在 实际 训练 中 ， 也 可 用 一 个 已 训练 过 的 系统 模型 声 〈 如 前 述 的 建 模 网 络 ) 共 代 实际 
被 控 系 统 进 行 逆 模 型 的 训练 〈 如 图 3.4 中 虚线 所 示 )。 采 用 间接 法 的 特点 是 ， 训 练 过 程 是 
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直接 指向 日 标的 。 因 为 它 是 基于 期 望 的 系统 输出 与 实际 输出 之 问 的 误差 来 调整 训练 控制 语 
权 值 的 ， 换 名 话说 ， 在 训练 过 程 中 ， 网 络 所 接受 的 样本 输入 对 应 于 它 最 终 工 作 时 接受 的 实 
际 笨 入 值 。 另 外 ， 在 系统 的 亲 关 系 不 是 一 一 对 应 的 情况 下 ， 用 此 法 也 能 对 期 望 的 特性 找到 
一 个 对 应 的 赣 。 


3.3 系统 中 的 控制 


3.3.1 监督 式 控制 


在 许多 难以 用 常规 榨 制 技术 设计 自动 控制 
器 ， 而 采用 手动 对 特 任 务 进行 反馈 控制 的 地 
方 ， 或 需要 用 自动 控制 器 来 模仿 人 的 行为 的 地 ”可 能 误 交 
方 ， 都 可 以 用 一 个 神经 网 络 来 实现 ， 网 络 的 训 
练 过 程 类 似 于 上 述 的 正 向 模型 的 训练 ( 见 图 ”期 望 控制 
3.5)， 但 是 ， 此 时 的 网 络 结构 可 以 根据 需要 不 
再 有 延 时 的 反馈 答 出 量 ， 只 要 对 应 于 比如 人 所 图 3.5 监督 式 网 络 控 制 训 练 图 
感觉 的 信息 ， 而 用 于 训练 网 络 的 目标 输出 则 对 记 于 人 对 系统 的 控制 量 。 另 外 ， 对 十 只 要 能 
够 号 出 足够 范围 内 一 定 的 对 感应 到 的 系统 输出 误差 给 出 相应 控制 值 的 地 方 ， 部 可 以 采用 这 
种 监督 式 训练 的 网 络 进行 非 线性 自动 控制 。 










神经 网 络 控制 器 要 

















3. 3. 2 直接 逆 控 制 


直接 逆 控 制 器 采用 的 头 是 一 个 逆 系 统 模型 ， 将 逆 模 型 疝 络 做 为 控制 器 使 用 ， 简 单 地 与 
被 控 系 统 析 级 联 ， 以 使 复合 系统 的 输出 与 期 望 的 响应 〈 即 网 络 输入 ) 相 一 致 。 很 明显 ， 这 
种 控制 策略 的 控制 精度 极 大 地 依赖 于 作为 控制 器 的 道 模型 的 精度 及 其 自 适 应 能 力 。 一 般 情 
况 下 可 能 会 产生 和 鲁 枯 问 题 。 低 普 乔 性 的 主要 原因 是 由 于 系统 为 开 环 控 制 ， 没 有 形成 闭环 回 
路 ， 解 决 这 一 问题 可 以 通过 以 下 两 种 方案 。 

第 一 种 方案 是 在 系统 进行 控制 的 同时 ， 并 行 地 对 控制 器 的 参数 进行 在 线 地 修正 ， 如 图 
3.6 所 示 的 整个 控制 系统 结构 图 ， 其 中 C2 表示 控制 中 使 用 的 道 模型 控制 荞 ，C1 表示 在 线 
调整 的 与 C2 结 移 完全 相同 的 逆 模 型 控制 器 ， 并 定期 将 产生 修正 的 新 权 值 送 入 到 C2 中 。 

第 -二 种 方案 是 对 整个 系统 加 入 负 反 馈 回路 《〈 见 图 3.7)。 由 于 逆 模 型 C2 的 使 用 ， 使 得 
前 多 回路 中 的 非 线性 得 以 抵消 ， 所 以 很 容易 采用 某 种 简单 的 常规 拧 制 器 Cl 的 设计 方法 ， 
设计 一 个 仙 反 馈 回 路 来 满足 期 望 的 系统 性 的 要 求 。 
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图 3.6 在 线 调整 权 什 的 利 控 制 系统 图 3.7 带 有 负 反 馈 回路 的 控制 系统 
3. 3. 3 模型 参考 控制 


自 适应 控制 中 的 模型 参考 控制 同样 可 以 用 于 神经 
网 络 的 控制 系统 中 ， 此 时 闭环 系统 的 期 望 特性 由 一 个 
适当 的 参考 模型 来 确定 这 个 参考 模型 也 可 以 用 一 组 
期 望 的 输入 /输出 数据 对 来 定义 ， 仔 缁 观察 一 下 可 以 
发 现 ， 前 面 所 用 过 的 间接 道 模型 控制 器 的 训练 过 程 ， 
实际 上 用 了 模型 参考 的 概念 ， 不 过 真正 意义 下 的 模型 
参考 控制 器 的 训练 是 在 财 环 回路 下 进行 的 (图 3.8)。 
图 3.8 网 络 模型 参考 控制 系统 ”系统 控制 的 目的 是 使 系统 输出 与 参考 模型 的 输出 渐 近 一 





limj >， (器 -yv(<s (3.4) 


对 某 一 个 确定 的 常数 2 之 口 成 立 。 

类 似 于 道 建 模 的 情况 ， 在 训练 控制 器 时 ， 被 控 系 统 可 以 用 训 夭 好 的 神经 网 络 模型 来 替 
代 。 对 于 控制 工程 中 的 模型 参考 控制 ， 所 求 的 自 适应 控 市 律 往往 会 含有 较 复 杂 的 ， 甚 至 难 
以 实现 的 控制 项 。 通 过 训练 ， 采 用 模型 参考 神经 网 路 控制 ， 可 以 克服 以 上 的 困难 。 


3. 3. 4 内 模 控制 


神经 网 络 的 正 向 模型 与 道 模型 在 内 模 控制 中 得 到 
了 充分 的 应 用 , 内 模 控 制 系统 的 结构 图 如 图 3.9 所 未， 
图 中 将 一 个 网 络 正 檬 型 与 实际 系统 相 并 联 ， 并 将 两 者 
的 输出 误差 作为 对 输入 信和 号 的 干扰 反馈 到 网 络 控制 器 
的 输入 庙 。 已 经 证 明 ， 对 于 开 环 稳定 的 系统 ， 利 用 内 
模 控 制 可 以 消除 干扰 和 扰动 ， 得 到 很 好 的 跟踪 控制 。 
内 模 控 制 已 在 过 程控 制 中 得 到 广泛 的 应 用 。 图 3.9 内 模 控制 系统 图 
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第 4 章 反馈 网 络 


反馈 网 络 《Recurrent Netwofk)， 又 称 自 联想 记忆 网 络 ， 其 目的 是 为 了 设计 一 个 网 络 ， 
储存 一 组 平衡 点 ， 使 得 当 给 网 络 一 组 初始 值 时 ， 网 络 通 过 自行 运行 而 最 终 收 伍 到 所 储存 的 
某 个 平衡 点 上 ， 

1982 年 ， 美 国 加 州 工学 院 物 理学 家 霍 普 非 尔 德 〈(J， Hopfield) 发 表 了 一 篇 对 人 工 神经 
网 络 研究 上 蝴 有 影响 的 论文 。 他 提出 了 一 种 具有 相互 联接 的 反馈 型 人 工 神 经 网 络 模型 ， 并 将 
“能 量 郑 数 ”的 概念 引入 到 对 称 霍 普 菲 尔 德 网 络 的 研究 中 ， 给 出 了 网 络 的 稳定 性 判 据 ， 并 
用 来 求解 约束 优化 问题 ， 如 TSP 问题 的 求解 ， 实 现 AD 转换 等 。 他 利用 多 死 截 普 菲 尔 德 
网 络 的 多 欧 引 子 及 其 吸引 域 ， 实 再 了 信息 的 联想 记忆 (Associative Memory) 功 能 。 史 外 ， 
霍 普 菲尔德 网 络 与 电子 模拟 线路 之 间 存 在 着 明显 的 对 应 关系 ， 使 得 该 网 络 易 于 理解 且 便 于 
实现 。 而 它 所 执行 的 运算 在 本 质 上 不 同 于 布尔 代数 运算 .对 新 一 代 电 子 神 经 计算 机 共有 很 
大 的 吸引 力 。 

反馈 网 络 能 铝 表 现 出 非 线 性 动力 学 系统 的 动态 特性 。 它 所 具有 的 主要 特性 为 以 下 两 
点 ， 第 一 ， 网 络 系统 具有 若干 个 税 定 的 平衡 状态 。 当 网 络 从 某 - -初始 状态 开始 运动 后 ， 网 
络 系统 总 可 以 站 化 到 基 一 个 稳定 的 半 衡 状态 。 第 二 ， 系 统 稳定 的 平衡 状态 可 以 通过 设计 网 
络 的 权 值 而 被 存 贮 到 网 络 中 。 

如 果 将 反馈 网 络 稳定 的 平衡 状 驴 作为 一 种 记忆 ， 那 么 当 网 络 由 任 - 初 始 状态 向 稳 态 的 
转化 过 程 ， 实 质 上 是 一 种 寻找 记忆 的 过 程 。 网 络 所 具有 的 稳定 的 半 衡 点 是 实现 联想 记忆 的 
基础 。 所 以 对 反馈 网 络 的 设计 和 度 用 必须 建立 在 对 其 系统 所 具有 的 动力 学 特性 理解 的 基础 
上 ,这 其 中 包括 : 网 络 的 稳定 性 、 稳 定 的 平衡 状态 以 及 判定 其 稳定 的 能 量 函 数 等 基本 概念 。 

针对 大 工 神经 网 络 的 特点 ， 若 按 其 运行 过 程 的 信息 流向 来 分 类 ， 则 可 分 为 两 大 类 : 前 
向 网 络 和 反馈 网 络 。 在 前 而 的 章节 里 ， 主 要 介绍 了 前 向 网 络 ， 通 过 许多 具有 简单 处 理 能 力 
的 神经 元 的 相互 组 合作 用 使 整个 网 络 具 有 复杂 的 非 线 性 逼近 能 方 。 在 那里 ， 着 重 分 析 的 臣 
网 络 的 学 习 规 则 和 训练 过 程 ， 并 研究 如 何 提高 网 络 整 体 非 线性 处 理 能 力 。 在 本 章 中 ， 我 们 
将 集中 讨论 反馈 岗 络 ， 遂 过 网 络 神经 元 状态 的 变迁 而 最 终 稳 定 于 平衡 状态 ,得 到 联想 存储 
或 优化 计算 的 结果 。 在 这 里 ， 着 重 关 心 的 是 网 络 的 稳定 性 问题 ， 研 究 的 重点 是 餐 样 得 到 和 
利用 稳定 的 反馈 网 络 。 

反馈 式 网 络 有 多 种 ， 这 里 主要 讨论 由 霍 普 菲尔德 提出 的 反馈 隔 络 。 专 普 菲 尔 德 阿 络 是 
单 层 对 称 全 反馈 了 网络， 根据 其 激活 函数 的 选取 不 同 ， 可 分 为 离散 型 的 稚 善 菲尔德 网 络 
《Diserete Hopfield Neural Network， 简 称 PHNN) 和 过 续 型 的 霍 普 菲尔德 网 络 (Continue 
Hopfield Neural Network， 简称 CHNN )。DHNN 的 激活 函数 为 二 值 型 的 ， 其 输入 、 输 出 为 
{ 人 -1.4 的 反馈 网 络 ， 主 要 用 于 联想 记忆 ，CHNN 的 激活 函数 的 输入 与 输出 之 间 的 关系 为 连 
续 可 微 的 单调 上 升 函数 ， 主 要 用 于 优化 计算 。 

起 普 菲 尔 德 网 络 口 经 成 功 地 应 用 于 多 种 场合 ， 现 在 仍 常 有 新 的 应 用 的 报道 。 有 具体 的 应 
用 方向 主要 集中 在 以 下 方面 : 图 像 处 理 、 语 音 处 理 、 信 和 号 处 理 、 数 据 查 询 、 容 错 计 算 、 模 
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式 分 类 、 模 式 识别 等。 
4.1 堆 善 菲尔德 网 络 模型 


反馈 网 络 的 网 络 结构 如 终 4.1 所 示 ， 





图 4. 1 反锁 网 络 结构 图 

该 网 络 为 单 层 全 反馈 了 网络， 其 中 每 个 神经 元 的 输出 都 是 与 其 他 神经 元 的 输入 相连 的 。 
所 以 其 输入 数 日 与 输出 层 神 经 元 的 数 日 是 相等 的 ， 有 『 = Y。 

在 反馈 网 络 中 ， 如 果 其 激活 函数 0) 是 一 个 二 值 型 的 重 函 数 ， 即 
ai = sgn(ri)，i=12.,r， 则 称 示 了 网络 为 离散 型 反馈 网 络 、 如 果 ai = 7m) 中 的 六) 为 一 
个 连续 单调 上 升 的 有 界 函 数 ， 这 类 网 络 被 称 为 连续 型 反馈 网 络 。 


4.2 DHNN 的 学 习 规则 


4.2.1 海 布 学 习 规则 


在 DHNN 的 网 络 训练 过 程 中 ， 运 用 的 是 海 布 《Hebb) 调节 规则 : 当 神 经 元 输入 与 输 
出 节点 的 状态 相同 《了 到 同时 兴奋 或 抑制 ) 时 ， 从 第 了 个 到 第 工 个 神经 元 之 间 的 连接 强度 则 
增强 ， 否 则 则 减弱 。 海 布 法 则 症 一 种 无 指导 的 死记 式 学 习 算法 。 

离散 型 电 普 菲尔德 网 络 的 学 习 目 的 ， 是 对 具有 9 个 不 同 的 输入 样本 组 
Pxo =[PIP..P9?]， 希 望 通过 亩 节 计 算 有 限 的 权 值 矩阵 多 ， 使 得 当 每 一 组 输入 样本 
忆 , 开 = 站 9， 作为 系统 的 初始 值 ， 经 过 两 络 的 工作 运行 后 ， 系 统 能 够 收 黎 到 各 自 答 
入 样本 矢量 本 身 。 当 上 = 1 时 ， 对 于 第 个 神经 元 ， 由 海 布 学 习 规 则 可 得 网 络 权 值 对 输入 
矢量 的 学 习 关 系 式 为 ; 





1 1 
# 二 让 书 j 而 (4.1) 


其 中 , 和 > 0 =1 2 了 = 1 2 rm 在 实际 学 习 规则 的 运用 中 ， 一 般 取 w = 1 或 
3 


、 -- 一 < 兴 一 mr- 一 -一 --- ----- --- 











w 工 ，(4.0 式 表明 了 海 布 调节 规则 ， 神 经 元 输入 己 与 输出 A 的 状态 相同 〈 即 同时 为 正 
天 


或 为 负 ) 时 ， 从 第 了 个 到 第 庆 个 神经 元 之 间 的 连接 强度 wy 则 增强 {( 即 为 正 )， 否 则 ww 则 减 
弦 《〈 为 负 )。 

那么 由 (4.1) 式 求 出 的 权 值 w 是 否 能 够 保证 mi = 六 = 二 ? 我 们 来 验证 一 下 ， 对 于 第 ;个 
输出 节点 ， 有 : 





1 1E、_ 1、_ 1 
二 一 SS 也 WP 六 二 SEC 二 ) 二 全 
Jj=1 


因为 户 和 台 值 均 取 二 值 {-1，1， 所 以 汉 其 为 正 值 时 ,输出 为 1， 其 为 负 值 时 ， 输 出 为 
0。 同 符号 值 相 乘 时 ， 答 出 必 为 1。 而 及 由 sgn(al ) 可 以 看 出 ， 不 一 定 需要 sgnta 力 的 值 ， 
只 要 符号 画 数 sgnf() 中 的 变量 符号 与 虽 的 符号 相同 ， 即 能 保证 sgna() = 好 。 这 个 符号 相 
同 的 范围 就 是 一 个 稳定 域 。 

当 太 = 时 ， 海 布 堆 则 能 够 保证 & 成立。 现在 的 问题 是 ， 对 于 同一 权 失 基 W， 网 
络 不 仅 要 能 够 使 一 组 输入 状态 收敛 到 其 稳 态 值 ， 而 是 要 能 够 同时 记忆 住 多 个 稳 态 值 ， 即 同 
一 个 网 络 权 舌 量 必 须 能 够 记忆 住 多 组 输入 样本 ,使 其 同时 收 敏 到 不 同 对 应 的 稳 态 值 。 所 以 ， 
根据 海 布 规则 的 权 值 设计 方法 ， 当 K 由 王 增加 到 2， 直 至 9 时 ， 则 是 在 原 有 已 设计 出 的 权 


倡 的 基础 上 ， 增 加 一 个 新 量 4 ,大 =2, 4 所 以 对 网 络 所 有 和 输入 样本 记忆 权 和 但 的 设计 
公式 为 : 








也 
wii =C 之 疆 引 (4.2) 
灰 = 


式 中 ， 矢 量 了 为 记忆 样本 。- 上 式 称 为 推广 的 学 习 调 节 规 则 。 当 系数 w = 1 时 ， 称 (4. 力 式 为 
了 的 外 积 和 公式 。 


DHNN 的 设计 目的 是 使 任意 输入 矢量 经 过 网 络 循环 最 终 收 化 到 网 络 所 记忆 的 某 个 样 
本 上 。 因 为 霍 普 菲 尔 德 网 络 有 wi =wi， 所 以 完整 的 霍 普 菲 尔 德 网 络 权 值 设 计 公式 应 当 为 ; 


好 
2 (4.3) 
大 =1 
汪 交 
用 向 和 形式 表示 为 ， 
W=ey rerr 44 
当 w=T 时 有 : 
w=yTror 一 地 {4.5) 


其 中 ，7 为 单位 对 角 和 矩阵 。 
由 (4.4) 式 和 (4.5) 式 所 形成 的 网 络 权 什 矩阵 为 零 对 角 阵 。 
采用 海 布 学 习 规则 米 设 计 记忆 权 值 ， 是 因为 设计 简单 ， 并 订 以 满足 w， =w 的 对 称 条 
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件 ， 从 而 可 以 保证 网 络 在 异步 工作 时 收 黎 。 在 同步 工作 时 ， 网 络 或 收敛 或 出 现 极限 环 为 2。 
在 设计 网 络 权 值 时 ， 与 前 向 网 络 不 同 的 是 令 初 始 权 值 w =0， 每 当 一 个 样本 出 现时 ， 都 在 


原 权 值 上 如 上 一 个 修正 明 ， 即 wj = wy + 红 寻 ,对 于 第 大 个 样本 ， 当 第 工 个 神经 元 输出 与 





第 / 个 神经 元 输入 同时 兴奋 或 同时 抑制 时 ， 胡 六 0 ， 当 齿 太 中 一 个 兴奋 一 个 抑制 时 ， 


好 比 <0 。 这 就 和 海 布 提出 的 生物 神经 细胞 之 侣 的 作用 规律 相同 。 





4.2.2 正 交 化 的 权 值 设 计 


这 一 方法 的 基本 思想 和 出 发 点 是 为 了 满足 下 面 四 个 要 求 : 
名 保证 系统 在 异步 工作 时 的 稳定 性 ， 即 它 的 权 值 是 对 称 的， 满足 ws = = 1 2 


仿 保证 所 有 要 求 记 忆 的 稳定 平衡 点 都 能 收 伍 到 自己 ; 

二 使 伪 稳 定点 的 数 日 尽 可 能 的 少 ， 

人 地 使 稳 定点 的 吸引 力 尽 可 能 的 大 。 

正 交 化 权 值 计算 公式 推导 如 下 : 

a) 已 知 有 3 个 需要 存储 的 稳定 平衡 点 1L， 有 ，,…，21， 7 e 六 ， 计 算 xf9- 玉 阶 矩 阵 
了 民 5X(9 “ 


7Y=[-m 用- 7 
b) 对 了 进行 奇异 质量 及 凋 矩 阵 分 解 ， 如 存在 责 个 正 交 和 矩阵 已 和 V 以 及 一 个 对 节 值 为 
站 的 奇 主 值 的 对 角 矩 阵 4， 满 足 : 
7= LAY 


7=Fiy2. re 
5 = 芽 iu 机 


v=riyvs ve 


K 维 空间 为 * 维 空间 的 子 空间 ， 它 由 天 个 独立 基 组 成 : 
大 二 Tank f4) 


设 {1U1U2 .1 和 为 了 的 正 交 基 ， 丽 { 避 如 志和 77 为 8 维 空间 中 的 补充 正 交 基 。 
于 而 利用 忌 矩 阵 夹 设计 权 便 。 


C] 定义 
天 昌 和 3 
WV+=-SUIHIDT，W -= TH (4.6) 
E=1 开 十 | 
总 的 联接 权 仁 为: 
Wi = 邦人 (4.7) 
其 中 ，?z 为 大 于 -1 的 参数 。 
中 网 络 的 闪 值 定义 为 : 
Bi; = 了 3 一 全 :74 (4.8) 


由 此 可 抑 ， 网 络 的 权 德 阵 是 山 两 部 分 的 权 系 阵 ' 和 全 相 加 而 成 的 ， 每 一 部 分 权 所 采 
用 的 都 是 类 似 于 外 积 型 法 得 到 的 ， 只 是 用 的 不 是 原始 要 求 记忆 的 样本 ， 而 是 分 解 后 正 交 矩 
阵 的 分 量 。 这 两 部 分 权 和 矩阵 均 满 足 对 称 条 件 ， 即 有 王 式 成 立 : 





十 十 一 一 
守 二 钱 ii WO 二 (4.9) 


因而 Wr 中 分 量 也 满足 对 称 条 件 。 这 就 保 计 了 系统 在 异步 时 能 够 收 各 并 且 不 会 出 现 极 
限 环 。 
下 面 我 们 来 推导 记忆 样本 能 铝 收 化 到 自己 的 有 效 性。 
ai 对 于 输入 样本 中 的 任意 目标 矢量 天 ，f = 7 2 ..， 9， 因为 (7 -7T4) 是 了 中 的 一 个 
量 ， 它 属于 4 的 秩 所 定 尽 的 下 个 基 空 间 中 的 矢量 ， 所 以 必 存 在 一 些 系 数 w ,Ca pe 





T 一 下 3 =of571l +CoirY 十 .十 CR 


Ti = Cl 上 Go 十 ,二 OF 十 下 了 


对 于 心中 任意 一 个 纺 ， 有 
厂 - = 三 


莱 工 卫 工 
=》U50D 大- 
i=| ii 十 1 
一 


由 正 交 性 质 林 知 ， 上 式 中 ， 只 有 1 = ! 那 一 项 与 已 ! 相 乘 后 结果 为 1， 其 余 项 均 有 
(CCZDITCOL=O。 


二 


对 于 样本 和 输入 六 ， 其 网 络 葵 出 为: 
而 =sgn(t 十 2z] 
= sgn(WtT 一 zyT94j 
= sgn|w+ 7 -TI 一 TV 一) 二 7?| 
- sanj 一 79) 二 7?] 
三 五 ! 
b) 当选 拌 第 9 个 样本 环 和 作为 答 入 时 ， 有 : 
克 人 =sgn(Wz74 十 Bz】 
=sgn(Wz79 + 了 9 -号 79】 
-el 
= 了 9 
oj 如 果 输 入 一 个 不 是 记忆 样本 的 P， 则 网 络 输出 为 ; 
A=sgn(W;P+Bi)= senfw -WP-T9j+ 7?| 
因为 六 不 足 已 学习 过 的 记忆 样本 ，P - 下 不 十 了 中 的 泉 量 ， 则 必然 有 
CRP 一 7 ) 关 三- ， 并 且 在 设计 过 程 中 可 以 通过 调节 力 = yz+- 二 -中 的 参数 z 揭 大 小 ， 
求 控制 (P -  ) 与 本 的 符号 ， 以 保证 输入 矢量 吕 与 记忆 样本 之 闻 存 在 是 够 的 大 小 余 翘 ， 
从 而 使 sgn(WIP+ 吾 ) 基 已 ， 使 忆 不 能 收敛 到 自身 。 
利用 参数 区 育 节 可 以 改变 伤 稳定 点 的 数 利 。 在 串 行 工作 的 情况 下 ， 伤 稳定 点 数 电 的 
减少 头 意 味 着 每 个 期 搬 稳 定点 的 稳定 域 的 扩大 。 对 于 任意 一 个 不 在 记忆 中 的 样本 忆 ， 总 可 
以 设计 一 个 弄 忆 排除 在 外 。 
胡 4.1 给 出 的 是 一 个 = 10， 学 习 记 忆 5 个 稳定 样 太 的 系统 ， 采 用 上 面 的 方法 进行 权 


的 设计 ， 以 及 在 不 同 的 f 霸 的 稳定 点 数 已 。 同 时 给 出 了 正 交 化 设计 方法 与 外 积 和 网 络 权 稍 
设计 法 的 比较 。 











表 4.1 不 同 的 友 的 稳定 点 数目 
人 二 
机 | 2 玫 认 
OO 0 | 5 
昌 然 正 父 化 设计 方法 的 数学 设计 较为 复杂 ， 人 得 与 外 积 和 法 机 比 较 ， 所 设计 出 前 平衡 稳 
定点 能 够 保证 收 名 到 自己 并 且 有 较 大 的 稳定 域 。 更 主要 的 是 在 MATLAB 工具 箱 中 局 将 此 
设计 方法 写 进 了 函数 solvehopm 中 ; 
[ 允 .b ] = solvehopfTy， 
用 目标 矢量 给 出 一 组 日 标 平 衡 点 ， 鼎 遇 数 solvehopm 可 以 设计 出 对 应 反馈 网 络 的 极 


















寻 宇 





值 和 信 差 ， 保 让 网 络 对 给 定 的 日 标 矢 盐 的 笨 入 能 收敛 到 稳定 的 平衡 点 。 但 网 络 可 能 也 包括 
其 他 伪 平 衡 点 ， 这 些 不 希望 点 的 数目 通过 选择 ? 作 〈 缺 省 值 为 10) 已 经 做 了 尽 可 能 的 限制 。 
一 呈 设 计 好 网 络 ， 林 以 用 一 个 或 多 个 输入 矢量 进行 测试 。 这些 得 入 将 趋 近 目 标 半 衡 点 ， 
最 终 找 到 它们 的 日 标 矢量 。 下 面 给 出 用 正 变化 方法 设计 权 亿 的 例子 。 
例 4.1 考虑 个 具有 黄 个 神经 元 的 愉 普 菲尔德 网 络 ， 竹 个 神经 元 共有 两 个 权 但 和 一 个 

















网 络 所 上 紧 存 贮 的 日 标 学 衡 点 为 一 个 列 矢 量 了 
7 了 = [1 -1; 
-1 1 


了 将 被 用 在 设计 函数 solvyehop, 阵 中 以 求 出 网络 的 权 倩 : 
[ YY,b j = solvehopfT); 
solvehop.m 国 数 返 回 网 络 的 权 值 与 偏差 为 : 
厂 = [0.6925 -0.4694; 
-0.4694 0.6925 ] 
刁 = 1.0e-|6a* [0.6900; 0.6900] 





可 以 看 出 其 权 攻 是 对 称 的 。 

下 画 用 日 标 天 量 作为 网 络 笨 入 来 测试 其 是 否 已 被 存 凡 到 网 络 中 了 。 取 和 输入 为 : 
Ptest =[1-1;-11]; 驼 输入 矢量 

用 米 进 行 测 试 的 函数 为 simuhop.m: 

和 = simuhop(Ptest， W, ,3); 名 计算 其 网 络 循 环 结 束 后 的 输出 


孙 数 布 端 中 的 第 四 个 参数 3 表示 网 络 反复 循环 的 次 数 。 经 过 3 次 的 运行 ， 如 同 所 希望 
的 那样 ， 网 络 的 结果 为 目标 矢量 了 。 
现在 我 们 想 知道 所 设计 的 网 络 对 任意 和 输入 矢量 的 收敛 结果 。 我 们 首先 给 出 六 组 输入 从 
量 为 : 
P= [0.56210.3577 0.8694 0.0388 -0.9309 0.0594; 
-0.9059 0.3586 -0.2330 0.6619 09.8931 0.3423 ]: 
在 经 过 25 次 循环 运行 后 ， 得 到 输出 为 ， 
4= [1.0000 -0.0191 1.0000 -1.0000 -0.8036 -1.0000， 
-1.0000 00191 -1.0000 1.0000 0.8036 1.0000]: 
如 同 所 看 到 的 第 2 组 及 第 5 组 的 输入 兴 量 没有 能 够 由 就 到 日 标 半 衡 点 上 。 然 和 而， 如 果 
让 其 运行 次 ， 它 们 则 能 够 收敛 到 第 2 个 月 标 失 量 上 。 
男 外 ， 当 取 其 他 随机 初始 值 时 ， 在 25 次 循环 后 殉 能 铝 收 化 到 所 设计 的 平衡 点 上 。 - - 
般 情 况 下 ， 此 网 络 对 任意 初始 随机 值 ， 在 和 运行 名 次 左右 均 能 铝 收 伍 到 网 络 所 储存 的 革 个 


4.3 离散 型 反馈 网 络 的 稳定 点 与 稳定 域 


尽 锁 网 络 因 结 构 上 输入 /输出 节点 相连 而 合 二 为 一 决定 其 网 络 系统 的 输出 状态 具有 动 
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态 变化 特性 。 当 对 网 络 输入 任意 初始 状态 ， 和 通过 反馈 回路 的 不 断 自动 循环 ， 网 络 的 输出 状 
态 最 终 总 可 以 变化 运动 到 某 种 状态 : 笠 定 、 循 环 、 发 散 或 混 光 。 设 计 者 的 任务 是 通过 设计 
反馈 网 络 权 值 ， 使 其 处 于 有 用 的 稳定 状态 ， 即 适 过 网 络 的 自动 循环 ， 而 最 终 达到 某 一 个 稳 
定 的 平衡 状态 ， 不 再 发 生变 化 。 如 果 将 期 望 的 稳定 平衡 点 作为 一 种 记忆 让 网 络 记 住 ， 那 么 
阅 络 由 任 一 初始 状态 向 稳 态 的 转化 过 程 ， 实 质 上 是 一 种 寻找 记忆 的 过 程 。 状 态 的 初始 值 则 
是 给 定 的 有 关 访 记忆 的 部 分 信息 ， 状 态 的 移动 过 程 则 是 从 部 分 信息 去 寻找 全 局 信息 的 过 
程 。 如 果 把 系统 的 稳定 点 变 成 一 个 能 量 函 数 的 极 小 点 ， 则 可 以 把 这 个 能 量 极 小 值 点 作为 一 
个 优化 目标 数 的 极 小 点 ， 把 状态 变 代 的 过 程 看 成 是 优化 某 一 个 目标 函数 的 过 程 。 以 上 召 
是 反馈 网 络 的 两 个 最 基本 功能 ;联想 记忆 和 优化 计算 。 反 馈 网 络 的 一 个 特点 是 它 的 解 并 
不 需要 真正 去 计算 ， 只 需要 适当 选择 反馈 网 络 结构 ， 按 某 一 种 方法 设计 其 权 值 ， 然 后 使 其 
让 行 工 作 运行 ， 即 可 使 初始 输入 在 状态 的 不 断 变化 过 程 中 ， 自 动 收 伍 到 所 属 的 稳定 状态 。 

在 反馈 网 络 的 研究 中 ， 研 究 最 多 的 还 是 网 络 权 值 的 设计 方法 。 因 为 要 想 利 用 从 初始 状 
态 到 稳定 点 的 运行 过 程 来 实现 对 信息 的 联想 存 取 ， 对 反馈 网 络 权 值 的 设计 必须 达到 下 列 目 
标 : 第 一 ， 网 络 系统 能 够 达到 稳定 的 收 你 ， 即 研究 系统 的 稳定 条 件 。 第 二 ， 网 络 的 稳定 点 
使 网 络 能 够 收 误 到 所 设计 的 稳定 平衡 点 上 。 第 三 ， 和 希望 所 记忆 的 稳定 点 有 尽 可 能 大 的 吸引 
域 ， 而 非 希 望 的 稳定 点 的 吸引 球 尽 可 能 的 小 。 

根据 输入 /输出 节点 的 兴 备 或 抑制 状态 一 致 性 原理 进行 权 值 设计 的 海 布 学 习 规 则 的 优 
点 是 设计 简单 ， 但 由 于 它 所 采用 的 方法 是 将 所 要 记忆 的 样本 ， 全 部 累加 到 权 值 上 的 方法 ， 
使 权 值 随 着 所 需 记 忆 的 样本 数量 的 增加 ， 而 不 断 产生 移动 变化 ， 具 有 记忆 样本 之 间 的 交叉 
干扰 ,产生 遗忘 和 闻 劳 现象 ， 对 于 样本 的 记忆 产生 不 可 靠 的 结果 。 正 训 化 权 值 设计 方法 能 
涡 较 好 解 次 此 问 题 。 它 能 够 保证 所 要 求 记忆 的 稳定 平衡 点 都 能 收敛 到 自己 ， 并 使 仿 稿 定点 
( 即 未 要 求 网 络 记 忆 ， 但 是 网 络 的 稳定 平衡 点 ) 尽 可 能 的 少 。 虽 然 此 方法 的 设计 稍微 复杂 了 
点 ， 不 过 在 有 关 软 件 工具 ， 如 MATLAB 环境 下 的 神经 网 络 工具 箱 的 帮助 下 ， 可 以 很 方便 地 
设计 出 网 络 来 。 所 以 只 需 疫 计 和 者 从 理论 上 ,概念 上 掌握 要 领 , 可 把 精力 投入 到 有 具体 应 用 上 。 

本 节 的 重点 在 于 对 稳定 点 及 其 稳定 域 进行 分 析 ， 主 要 是 想 回 答 下 列 问题 : @ 当 反馈 网 
络 的 结构 确定 以 后 ， 网 络 的 稳定 平衡 点 的 数目 是 否 确 定 ? 四 哪些 输入 是 稳定 的 平衡 点 ? 印 
随 着 所 要 求 记 忆 的 稳定 平衡 点 数目 的 增加 ， 其 吸引 域 如 何 变化 ? 其 缩小 的 规律 如 何 ? 全 不 
稳定 的 平衡 点 有 哪些 ? 

本 节 是 通过 实际 设计 网 络 记忆 平 衡 点 ， 然 后 使 其 运行 工作 ， 并 采用 简单 明了 的 作 图 方 
式 ， 直 观 地 观察 在 不 同 网 络 结构 情况 下 的 平衡 点 收 敏 趋势 及 收 敏 域 的 范围 ， 从 而 揭示 反馈 
网 络 在 不 同 网 络 结构 下 的 轨迹 变化 规律 ， 及 其 进行 联想 记忆 、 容 错 和 优化 计算 的 实质 ， 使 
人 人们 对 反馈 网 络 的 工作 原理 及 其 应 用 有 更 深入 的 认识 。 下 面 首先 从 简单 的 两 个 输入 神经 元 
节点 的 网 络 结 梯 入 于 ， 详 细 探 讨 每 一 种 记忆 的 可 能 性 ， 并 总 结 出 共性 。 然 后 对 复杂 的 三 个 
输入 神经 元 节点 的 阅 络 情况 进行 研究 ， 并 对 四 个 输入 神经 元 节点 的 网 络 情况 进行 推论 归 
纳 。 最 后 对 在 不 同 结构 情况 下 网 络 平 点 的 收 伍 趋势 及 收 敏 瑾 的 范围 给 予 小 结 ， 














4.3.1 两 个 输入 神经 元 的 情况 


到 馈 网 络 权 值 的 设计 是 采用 正 变化 设计 方法 。 与 一 般 定 义 的 离散 专著 非 尔 德 网 络 不 
局 ， 用 正 交 化 设计 方法 进行 权 值 设计 得 到 的 反馈 网 络 的 权 值 Wi <0， 且 偏差 有 z=D。 不 过 
满足 网 络 的 单 层 对 称 性 ， 即 有 多 =m。 为 了 能 够 清晰 地 看 到 网 络 输 出 变化 的 轨迹 ， 在 实 
验 的 网 络 运行 工作 的 过 程 中 ， 给 网 络 采用 了 如 图 4.2 所 示 的 一 个 输出 范围 为 广 ].1 的 乞 和 
函数 。 这 使 得 网 络 在 运行 的 过 程 中 ， 也 就 起 网 络 状 态 达 到 其 稳 态 -1 或 1 的 过 程 中 ， 可 以 
输出 一 个 从 初 态 逐渐 变化 到 稳 态 的 轨 迹 ， 使 我 们 可 以 很 清楚 地 看 到 网 络 运行 过 程 中 的 暂 态 
变化 的 过 庐 过 程 ， 在 一 定 程 度 上 为 我 们 的 认识 网 络 的 特性 提供 了 方便 。 





图 4.z 反馈 网 络 的 激活 国 数 
由 离散 型 反馈 网 络 激活 函数 可 以 知道 ， 对 于 具有 两 个 输入 神经 拖 的 反馈 网 络 ， 系 统 的 


可 能 平衡 点 放 当 为 : 


see 


根据 前 菠 4. 2 中 的 分 析 可 知 ， 不 论 采 用 何 种 方法 ， 当 网 络 只 记忆 一 个 平衡 点 时 ， 定 能 
保证 网 络 对 该 稳定 点 输入 准确 地 收 化 到 自身 ， 并 且 对 网 络 所 有 其 他 任意 的 输入 点 均 能 收 伍 
到 该 平衡 点 。 而 当 要 网 络 记忆 较 多 平衡 点 时 ， 就 有 可 能 出 错 。 正 交 化 的 权 秆 设计 方法 能 够 
保证 使 需要 记忆 的 稳定 平衡 点 都 能 收 敏 到 自身 。 首 先 来 观察 一 下 记忆 四 个 半 衡 点 中 的 两 个 
平衡 点 时 的 稳定 域 情 况 。 

TD 设计 网 络 记忆 的 稳 定 平衡 点 为 

T= fl -1; 
-1 如 

利用 MATLAB 环境 下 的 神经 了 网络 工具 箱 来 进行 网 络 的 设计 十 分 简单 ， 只 要 根据 期 望 网 
络 记忆 的 平衡 点 T 的 值 ， 通 过 调用 采用 正 交 法 权 值 的 设计 函数 [W， 量 = seolivyehop( T ) 即 
可 完成 。 阿 络 设计 完成 后 可 得 权 值 为 

W =[ 0.6925 -0. 4694 
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-0. 4694 0. 6925] : 
信 差 为 
B = 1.0e-016 #f0. 6900 
0. 6900] ; 
从 网 络 的 权 值 上 可 以 看 出 ， 押 设计 的 网 络 权 值 是 对 称 的 ， 即 有 wj =w 产 ， 并 且 
vi 关 0， 俩 差 下 zx0。 
为 了 观察 网 络 工 作 效 果 ， 向 设计 好 的 网 络 输入 任意 测试 数据 


P=[ 0. 5000 0.9003 0.7826 -0.0871 -0.8000 -0.6012 0. 1200 -0.2145 
0. 5000 -0.5377 0.7242 -0.9630 -0.8000 0.2317 0.7068 -0.0890 ] ; 


对 于 两 个 输入 节点 的 反馈 网 络 的 箱 出 变化 情况 , 可 以 用 分 别 表示 两 个 节点 分 量 的 平面 
坐标 来 画 出 了 网络 输出 的 运动 变化 轨迹 ， 如 图 二 3 所 示 ， 图 中 的 横 举 标 败 第 一 个 神经 元 节 点 
的 输出 , 级 坐 标 为 第 一 个 神经 元 节点 的 输出 , 图 中 “+” 表 示 被 网 络 记 忆 的 稳定 平衡 点 , “又 ” 
为 网 络 初始 输入 数据 点 ,“o” 表 示 网 络 在 连续 不 断 循 环 工作 下 的 输出 执 迹 。 对 于 所 设计 的 
反馈 网 络 ，[， -1 和 [-1，j 点 为 稳定 平衡 点 ， 由 图 4. 3 可 以 看 出 该 网 络 将 整个 坐标 平面 
以 两 个 平衡 点 连 线 的 垂直 平分 线 为 分 界线 平分 为 两 部 分 ， 并 以 平衡 点 之 间 连 线 作 为 收 伍 路 
径 走 向 ， 所 以 每 一 个 平衡 点 的 稳定 域 是 相当 大 的 :各 占 半 个 平面 。 那 么 半 衡 点 连 线 间 的 乖 
直 半 分 线 ， 包 括 另 外 两 个 未 被 记忆 的 平衡 点 [-I: -本 和 [1:， 匡 的 运动 趋势 性 什么 呢 ? 从 赂 
中 昌 线 走向 可 以 看 到 ， 它 们 收 敏和 到 了 原点 [0; 0 。 原 点 [0: 中 是 个 什么 类 型 的 点 昵 ? 只 要 
我 们 将 网 络 的 运行 循环 次 数 加 大 ， 便 可 发 现 ， 经 过 478 次 循环 后，[~1; - 茹 和 [1;， 1 两 点 
连 线 上 的 任何 点 ， 在 收 敏 到 诛 点 [0;: 0 之 后 ， 也 转向 收 敏 到 [1，-I] 或 [-1，]I 点 了 。 所 以 ， 
原 点 10: 避 是 一 个 不 稳定 的 平衡 点 。 这 主要 是 由 计算 机 的 计算 精度 造成 的 一 定 的 计算 误差 ， 
即使 这 个 偏差 非常 小 ， 但 一 旦 偏离 了 [-1:， -1] 和 [1:， 1 两 点 的 连 线 ， 则 落 到 了 平衡 稳定 点 
的 区 城内 而 转向 收 敏 到 稳定 的 半 衡 点 。 

2) 设计 网 络 记忆 平衡 点 为 : 

T = [1 -1: 
1 -1] 

以 同样 的 方式 设计 网 络 权 值 ， 可 得 权 值 : 

W =[ 0.6925 0. 4694 
0. 4694 0. 6925 ] ; 











偏差 为 : 
B =1.0e-016 #[0.6900 
-0.6900 ] 。 
向 网 络 和 输入 任意 测试 矢量 : 


P = [0.8000 0.5000 -0.1098 -0.0580 0.6924 -0.5947 0.6762 0.3626 
0. 8000 -0.5000 0.8636 -0.1627 0.0503 0. 3443 -0.9607 -0. 2410 ]: 
所 设计 的 网 络 对 给 定 的 测试 矢量 P 的 输出 轨迹 图 如 图 4.4 所 示 。 从 中 加以 看 出 , 与 1 
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-1 或 [1 菇 为 平衡 点 的 第 一 种 情况 类 似 ， 以 [1: I 和 [1，- 为 半 征 点 的 反馈 网 络 的 稳 
定 域 也 将 整个 平面 划分 为 责 个 区 域 ， 并 以 两 点 的 垂直 平分 线 为 界 ， 同 样 存 在 该 垂直 平分 线 
上 的 所 有 点 都 收 侣 于 不 稳定 的 平衡 点 [0 人 名 的 情况 。 

3) 改变 记忆 对 角 线 上 的 点 的 做 法 ， 将 表示 网 络 输 出 的 平面 内 某 一 个 边线 上 的 两 个 含 
有 1 的 点 作为 平衡 蕊 让 网 络 记忆 ， 即 设计 网 络 记忆 平衡 点 
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1 
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1 
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| 
世上 
站 


7 05 贡 一 人 0 15 1 全 eee5 学 5 1 
图 4. 3 平衡 点 为 1 - 匡 和 图 4,4 平衡 点 为 [1， 电 和 图 4.5 平衡 点 为 [~-1 -1 和 
[-1 1 坷 时 的 稳定 域 FL-t 时 的 称 定 域 和 , - 吉 时 的 稳定 域 
T1 = [-1 1; 
-1 - 


再 次 设计 网 络 权 值 ， 可 得 权 值 : 
外 =[ 1.1618 0 
站 0.2231 ] 
偏差 为 ; 
3 =[ 0 
-0.8546 ] 
同样 ， 对 所 设计 的 网 络 输入 一 组 测试 数据 ; 
P=[ 0 站 -0.3176 0.4542 0.6770 -0.2592 0.0931 0.3891 
0. 8000 -0. 5000 0.0682 -0.3814 0. 1361 0.4055 -0.1102 0.2426 ]; 
可 得 如 图 4.5 所 示 网 络 送 行 轨 迹 图 。 与 前 两 种 收 敏 域 有 所 不 同 ， 此 时 的 收 敏 域 分 为 左 
布 两 个 平面 ， 它 们 以 [1，- 寺 和 [1，- 匡 两 点 连 线 的 乖 直 平分 线 为 分 异 线 。 乖 直 平分 线 上 
的 所 有 点 都 收 黎 到 上 0; - 茹 点。 同样 ， 这 个 点 也 为 不 稳定 的 平衡 点 。 同 理 可 知 ， 当 选择 


全 
T2 = ， T3= : T4= 
1 1 1 一 ! 1 -=1! 
分 别 作为 网 络 的 收 敏 平衡 点 让 其 记忆 时 ， 其 收 化 域 分 别 以 平衡 点 过 线 的 乖 直 平分 线 为 界线 
的 琐 部 分 ， 并 且 垂 直 平 分 线 与 两 点 连 线 的 交点 为 不 稳定 的 平衡 点 。 
3) 取 轨 个 平 街 点 中 的 三 个 点 作为 平衡 点 记忆 
T=f[f-l -1 1 
-1 1 2- 
以 同样 的 方法 可 以 设计 出 网 络 权 值 为: 
用 =[ 0.6925 -0. 4694 
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-0. 4694 0.6925 ] 
偏差 为 : 
B = 1.0e-016 + E 0.6900 
0.6900 ] 
向 网 络 输 入 任意 测试 数据 : 
P =[ -0.6122 0. 1384 -0.5312 0.8632 0.3111 0.2546 -0. 2066 0. 3104 
0. 8096 0. 2636 0. 0976 -0.3296 -0.2162 0. 3982 -0. 1727 0. 6752 ] 
这 里 首先 值得 一 提 的 是 ， 此 时 所 获得 的 网 络 权 值 与 网 络 记 忆 两 个 平衡 点 1 时 的 情况 
的 权 俯 完全 相同 。 但 将 商 图 (图 4.3 与 图 4.6(a)) 对 比 可 邢 ， 网 络 的 输出 轨迹 是 大 不 相同 
的 。 这 说 明 ， 网 络 对 不 同 平衡 点 的 权 值 设计 过 程 是 具有 动态 记忆 的 。 由 于 增加 了 所 要 记忆 
的 平衡 点 数目 ， 所 记忆 的 稳定 点 的 稳定 域 减 小 了 ， 由 两 个 稳定 点 时 的 半 个 平面 减少 到 三 个 
稳定 点 时 的 四 分 之 一 平面 。 以 [0;， 0 作为 泽 标 轴 的 原点 ， 记 忆 三 个 稳定 点 时 的 稳定 域 正 好 
是 每 个 稳定 点 所 处 的 象限 。 四 个 稳定 点 中 没有 被 记忆 的 点 [1; J 所 在 的 第 一 象限 中 的 网 络 
输入 将 全 部 收 和 但 到 [1，1] 上 ， 该 点 为 伪 稳 定点 。 从 图 4.6(a 中 可 以 清楚 地 看 出 ， 在 输入 
的 测 涝 点 P 中 处 于 第 一 象限 的 三 个 点 [0. 1384，0. 2636]， [0. 2546:， 0. 3982], [0. 3104; 
0. 6752] ， 都 收 化 到 未 被 设计 为 网 络 记忆 的 平衡 点 [1; 1] 上 了 。 该 结论 可 以 推广 到 其 他 三 
种 情况 ， 如 对 于 只 记 权 四 个 点 中 三 个 稳定 点 的 网 络 ， 未 被 记忆 的 点 在 网 络 工作 时 也 有 一 个 
收 敏 域 ， 并 这 能 作为 区 稳 定点 出 现 。 作 为 四 个 收 伍 域 的 的 分 界线 一 坐标 轴 上 的 点 将 分 别 
收 和 伍 到 [1;， 0]，[1; 0]，[0，-I，[0， 菇 或 [0， 0] 上 ， 它 们 是 不 稳定 的 平衡 点 。 
图 4.6 介 ) 给 出 平衡 点 为 [-1，1]，[1， - 羽 和 [-1， -1 时 ， 网 络 经 过 241 放 的 运行 工 
作 ， 将 不 稳定 的 平衡 点 收 竹 到 各 自 平衡 点 上 的 轨迹 图 。 














《Hu) 人 b) 人 oo) 
图 4.6 网 络 记忆 的 平衡 点 多 于 两 个 时 收 敏 域 的 情况 
4 设计 网 络 将 四 个 点 全 部 作为 平衡 点 记忆 
T=[-l1 -1 11 
-1 1 -1 1] 


由 此 得 网 络 权 值 为 : 
风 =[ 1.1618 -0.0000 


4 各 


-0.0000 1.1618 ] 
信 辩 为: 
B = 1.0e-016 #[ 05390 
0. 1797 】 
向 网 络 输入 任意 测试 数据 
P = [ -0.8587 -0.5457 -0.0836 0. 1650 -0.8514 -0.2408 0.5418 0. 2764 
-0. 9761 0.0325 0.4064 0.0184 -0.6135 -0. 4471 -0.3721 0.9731 ] 
可 得 如 图 4. 6(c) 所 示 的 运行 轨迹 图 。 
根据 前 面 情 说 的 结果 已 经 很 窜 易 推导 出 此 时 的 收 敏 域 为 各 平衡 点 所 在 的 得 限 ， 并 且 与 
情况 3 相同 ， 即 点 [-1;， 仙 ，[0，1]，[0: 0]，[1， 0 和 [0: -] 避 均 为 不 稳定 的 平衡 点 。 
不 过 实验 表明 ， 它 们 在 网 络 运行 循环 次 数 较 多 的 情况 下 ， 也 均 会 收敛 到 某 一 个 平衡 点 上 ， 
这 主要 基山 于 计算 机 的 计算 误差 《即使 这 个 误 善 只 有 10# 数量 级 )》 使 网 络 输 出 值 偏 离 了 
不 稳定 点 的 收 敏 域 ， 落 到 了 稳定 点 的 收敛 域 中 造成 的 ， 这 一 结果 的 出 现 正 好 符合 不 稳定 平 
衡 点 的 特性 。 


4. 3.2 网 络 输入 神经 元 为 三 个 时 的 情况 分 析 


当 网 络 输入 神经 元 为 三 个 时 ， 其 输入 /输出 变量 也 由 两 个 变 成 了 三 个 ， 从 而 使 得 网 络 
的 平衡 点 增 至 为 2 =8 个 ， 描 述 网 络 输出 运行 轨迹 的 图 形 也 出 平面 变 成 了 立体 空间 。 根 据 
上 一 节 对 两 个 输入 节点 的 情况 与 分 析 ， 可 以 比较 窜 易 地 推 寻 出 以 下 的 结论 。 

世 当 网 络 只 记忆 责 个 平衡 点 时 ， 其 收 化 域 应 为 出 两 点 连 线 的 垂直 平分 面 所 截 成 的 两 点 
所 在 的 空间 ， 垂 直 平 分 面 上 的 点 均 收 化 到 对 应 的 售 有 0 的 坐标 点 上 ， 这 些 坐 标点 者 是 不 稳 
定 的 平衡 点 。 

怨 当 网 络 记忆 三 个 平衡 点 时 ， 其 收 敏 域 为 由 三 全 点 所 组 成 的 三 角形 平面 上 ， 从 每 条 过 
上 垂直 袜 下 的 平面 所 组 成 的 三 个 子 空间 。 同 样 ， 三 个 垂直 平面 上 的 点 均 收 敛 到 某 个 含 0 的 
坐标 点 上 ， 这 些 坐标 点 霉 为 不 稳定 的 平衡 点 。 

雹 当 网 络 记忆 四 个 以 及 多 于 四 个 平衡 点 时 ， 其 收 和 化 域 为 空间 上 的 八 个 象限 ， 且 有 未 被 
记忆 的 平衡 点 ， 在 网 络 运行 工作 时 ， 可 能 会 以 俯 稳 定点 的 形式 出 现 。 正 交 化 设计 方法 的 另 
一 个 优点 则 是 使 网 络 工作 时 ， 尽 量 少 地 出 项 伪 稳 定点 。 

下 面 做 出 当 网 络 记忆 全 部 从 个 平衡 点 时 的 图 形 , 此 时 被 记忆 的 平衡 点 为 : 

T=[-l-l1>-1-1 1 1 11 
-1 1 7 1- 1 -1 1 
-1 -1 1 1- -L 1 1 











设计 出 的 网 络 权 值 为 : 
W = [1.1618 -0.0000 0.0000 
-0.0000 1.1618 -0.0000 
0.0000 -0.0000 1.1618 ] 
偏差 为 ; 
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B = 1.0e-016 【0.0000 
-0.3593 
0. 3593 ] 
向 网 络 输入 任意 一 组 测试 数据 : 
P = [-0.3908 0.3644 -0.6983 0.7200 -0.0069 0. 2898 -0.3161 0.0682 
-0. 6207 -0.3945 0.3958 0.7073 中 7995 0.6359 -0. 4205 10. 4542 
-0. 6131 0.0833 -0. 2433 0. 1871 0. 6433 0. 3205 -0,. 3176 -0.3814 ] 
网 络 在 初始 输入 值 下 运行 到 各 自 平衡 点 的 轨迹 图 如 图 4.7(a 所 示 。 从 中 可 以 明显 地 
看 到 各 个 点 都 在 自己 所 处 的 象限 内 收 伍 到 所 在 象限 的 稳定 平衡 点 上 。 不 过 ， 网 络 还 存在 不 
稳定 的 平衡 点 ， 例 如 困 设 计 好 的 网 络 输入 以 下 点 : 
[0.8 0.8 -0.8 -0.8 0.3 0.6 -07 -03 0 0 0 0 
0.8-08 08-05 0 0 0 0 02 07-0.72-0.4 
0 0 0 0 07-02 0.6-0.5 0.4 -04 083 -0.3] 
所 得 的 和 输出 运行 轨迹 如 网 4.7 了 人) 所 示 ， 可 见 这 些 点 分 别 收 伍 到 了 以 下 各 点 : 
[ 1L 1 -1 -1 1 1 -1 -1 0 0 0 0 
1 -1 1 -1 00 0 0 1 1 -1 an- 
0 0 0 0 1 =- 1 -= 1 -1 1 -1 
这 些 点 均 为 不 稳定 的 平衡 点 ， 因 为 当 增 大 网 络 的 循环 次 数 后 ， 所 有 上 述 12 个 点 均 分 
别 哆 伍 到 8 个 稳定 的 平衡 点 上 。 如 在 同样 的 输入 下 ， 使 网 络 达到 循环 264 次 时 ， 则 输出 变 
为 : 





1 1 1 1 1 村 1 -1 1 一 | 1 -1 
实际 上 ， 只 要 包含 0 的 坐标 点 都 是 不 稳定 的 平衡 点 ， 所 以 四 个 神经 元 节点 的 网 络 除了 
上 述 12 个 不 稳定 的 平衡 点 外 ， 还 有 另外 7 了 个 不 稳定 的 平衡 点 ， 它 们 分 别 是 [0; 0; 0]，[0; 


30 


0 1 ，[0: 0; - 吉 j，[0; 1: 0]，[0: -1 0，b 8080，[-1: 0: 0]。 

就 不 稳定 的 平衡 点 小 结 如 下 : 对 于 具有 二 神经 元 节点 的 网 络 ， 最 多 可 能 的 不 稳定 的 半 
衡 点 有 5 个 ， 也 就 是 平分 线 上 的 点 ; 对 于 具有 三 神经 元 节点 的 网 络 ， 有 19 个 可 能 的 不 稳 
定 半 衡 点 ， 由 此 可 推出 对 于 具有 四 神经 元 节点 输入 时 ， 最 多 可 能 的 不 稳定 的 半 衡 占有: 


CC 二 CO2TC1 820 =65( 个 ) 


即 泽 标 中 所 有 含有 0 的 点 。 

通过 以 上 的 分 析 ， 我 们 己 经 可 以 伐 助 于 想象 来 推出 四 个 神经 元 节点 以 上 的 网 络 输 出 运 
行乞 迹 的 情况 : 每 个 平衡 点 都 具有 自己 的 一 个 稳定 域 ， 且 其 大 小 取决 于 网 络 记忆 平衡 点 数 
目的 多 少 。 当 网 络 记忆 全 部 可 能 的 壮 衡 点 时 ， 稳 定 域 为 最 小 。 不 过 当 少 于 最 多 的 平衡 点 时 ， 
了 网 络 运 行 时 可 能 会 出 现 收敛 到 盆 稳 定点 的 情况 。 这 点 在 实际 应 用 时 应 当 特 别 注 意 ， 息 旺 避 
免 这 种 情况 的 出 现 ， 它 可 能 会 出 现在 进行 模式 辨识 时 模式 缺损 太 多 的 情况 下 。 另 外 一 个 结 
论 是 : 在 设计 网 络 作为 模式 辩 识 时 应 当 尽 量 多 些 利 用 可 能 有 的 稳定 的 平衡 点 ， 以 减少 不 稳 
定 的 平衡 点 的 数量 。 这 与 人 们 直觉 上 认为 应 使 网 络 尽量 少 记忆 平衡 点 以 扩大 稳定 域 的 结论 
大 不 同 的。 因为 各 个 稳定 点 的 稳定 域 的 大 小 是 能 够 得 到 保证 的 。 但 盆 稳 定点 的 出 现 可 能 使 
得 网 络 得 出 错误 的 决定 或 未 定义 的 结果 。 


4.3.3 小 结 


通过 以 上 实验 可 以 得 出 结论 : 对 于 具有 r 个 输入 神经 元 、 输 出 函数 为 1 的 反馈 网 络 ， 
当 采 用 正 交 权 值 设计 法 ， 所 设计 的 网 络 最 多 具有 3 个 平衡 点 ， 其 中 ， 人 2 个 是 稳定 的 平衡 
点 ， 另 外 开 -2 个 是 不 稳定 的 平衡 点 。 每 个 稳定 点 的 稳定 域 〈 吸 引 域 ) 为 以 该 点 为 中 心 ， 
棱 长 为 2 的 多 边 体 〈 形 ) ， 各 平衡 域 的 边界 部 分 为 不 稳定 半 衔 点 的 吸引 域 ， 不 稳定 的 平衡 
点 在 两 两 稳定 半 衡 点 连 线 的 中 点 上 。 


4.4 连续 型 堆 普 菲尔德 网 络 





电 普 菲尔德 网 络 可 以 推广 到 输入 和 输出 都 取 连 续 数 值 的 情形 。 这 时 网 络 的 基本 结构 不 
变 ， 状 态 输出 方程 形式 上 也 相册 。 若 定义 网 络 中 第 诗 个 神经 元 的 输入 总 和 为 十 ， 输 出 状态 
为 wm， 则 网 络 的 状态 转移 方程 可 写 为 : 


一 三 站 之 WP Hi (4.10) 
j=1 
其 中 ， 神 经 元 的 激活 函数 为 S 型 的 函数 〈 或 线性 饱和 函数 》: 
本 1 
由 = {4.11) 


或 
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2=tanh(4 人 (mi (4.12) 
两 个 函数 共同 的 特点 是 当 疡 一 及 嫩 一 天 时 ， 函 数值 饱和 于 两 极 ， 从 而 限制 了 神 


经 网 络 中 输出 状态 4 的 增长 范围 。 显 然 ， 若 使 用 函数 诱 ( ) 则 i sf0,1， 车 使 用 疡 (*)， 
则 ai e[ 广 已。 函数 庙 (， ) 和 产 (… ) 中 的 参数 4 用 以 控制 $ 型 函数 在 0 点 峙 近 的 变化 数 。 





图 4.8 连续 息 普 菲尔德 网 络 激 活 冰 数 


4.4. 1 对 应 于 电子 电路 的 了 网络 结构 

电子 电路 与 CHNMN 之 间 存 在 着 直 芒 的 对 应 关系 。 第 i 个 输出 神经 元 的 模型 如 图 4.9 所 
示 ， 基 中， 运算 放 大 器 模拟 神经 元 的 激活 函数 ， 所 以 电压 xz 为 激活 函数 的 和 输入， 也 称 为 
网 络 的 状态 ， 各 并 联 的 电阻 妨 值 决定 各 神经 泡 之 间 的 连接 强度 ; 电容 C 和 电阻 * 模拟 生 
物 神 经 元 的 输出 时 间 常 数 ， 另 外 电流 了 模拟 闪 值 。 其 中 ，i 站 2. ,六 整个 网 络 是 由 








图 49 第 字 个 输出 神经 元 电路 模型 
个 同样 的 模型 并 联 组 成 ， 每 个 模型 都 具有 和 相同 的 输入 矢量 Y = [fw mw, .……，”]， 状 态 矢量 和 














三 由 每 个 模型 的 输出 六 组 合 而 成 。 电 路 状态 与 输出 之 间 的 关系 图 如 图 4.10 所 示 。 这 也 是 


放大 器 的 特性 图 。 
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对 于 图 4.9 所 示 的 电路 图 ， 根 据 克 西 堆 夫 电流 定律 ， 有 下 列 方 程 成 立 : 


dt “上 
娘 一 一 十 一 = 7 ， 一 呈 十 元 
2 站 二 4 





对 上 式 进 行 移 项 及 合并 , 





型 . 
让 


图 4. 10 网 络 输 出 吕 与 状态 疙 的 关系 图 


-7 全 + 宙 + 六 十 工 


石 妇 局 届 让 


则 可 得 : 
CO = 一 下 + + 也 
外 
由 此 可 得 电路 输入 的 累加 值 为 : 
= 袜 wyy t+ (4.13) 


产 1 


此 式 与 人 工 神经 网 络 模型 的 加 权 值 一 致 。 
电路 状态 值 与 加 权 输 入 值 之 间 的 关系 可 用 一 阶 微分 方程 式 表示 : 


CO - 工 十 及 (4.14) 
di 有 
而 电路 输出 与 状态 之 冯 的 关系 为 一 个 单调 上 升 的 有 界 函数 ; 
1 二 了 (0 ) (4.15) 


方程 44.14) 反 瞻 了 网 络 状态 连续 更 新 的 意义 ， 它 是 与 离散 形式 不 同 之 处 ，(4.13) ~ 
(4,.1$) 式 结合 在 一 起 描述 了 _ CHNN 的 动态 过 程 随 着 时 间 的 流逝 ， 网 络 趋 于 稳定 状态 ， 
可 以 在 输出 端 得 到 稳定 的 输出 矢量 。 对 于 由 王 个 相互 连接 的 电路 模型 组 成 的 网 络 ， 矢 个 
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慌 型 均 满 足 〈4.13) ~ 4.15) 方程 ， 可 将 其 邱 成 抵 阵 形式 ， 为 了 简便 起 见 ， 令 C= 1。 


王 (站 所 ( WII Wia Wi | 态 的 厂 
人 加 和 人 和 了 
20| oj 全 二 ee 罗 
: 丽 : : : ， 
玉 { 坟 吕 m1 ( 昌 Wall Wana 四 人 nr 下 ( 坟 了 
或 
D=- VC+WV+1 (4.16) 


这 是 一 个 上 维 的 线性 微分 方程 。 当 再 四 =0i=12r 时 ， 上 式 变 为 : 


也 三 玉 (WY 十 门 
者 把 了 =f .55 看 作 阔 位， 那么 上 式 就 与 人 工 神经 网 络 的 加 权 输 入 和 六 形式 相似 。 
如 果 此 时 代表 激活 函数 丽 四 的 运算 放大 器 的 放大 倍数 足够 大 到 可 视 为 “ 值 型 的 硬 函 数 ， 
连续 型 反馈 网 络 即 变 为 离散 型 的 反馈 网 络 。 所 以 也 可 以 说 ，DHNN 是 CHNN 的 一 个 特例 。 


4.4.2 霍 普 菲 尔 德 能 量 函 数 及 其 稳定 性 分 析 


普 非 尔 德 在 80 年 代 补 提 出 了 一 个 对 单 层 反馈 动态 网 络 的 稳定 性 判别 的 函数 ， 这 个 
芳 数 有 了 明确 的 物理 意义 ， 足 建立 在 能 量 基础 上 的 ， 同 李 雅 善 诺 夫 函数 一 样 ， 赴 普 菲 尔 德 认 
为 在 系统 的 运动 过 程 中 ， 共 内 部 贮存 的 能 量 随 着 时 间 的 增加 而 逐渐 减少 ， 当 运动 到 平衡 状 
态 时 ， 系 统 的 能 量 耗 尽 或 变 得 最 小 ， 那 么 系统 自然 将 在 此 平衡 状态 处 渐 近 稳定 ， 即 有 
lim VD =1e。 因此， 才能 找到 一 个 可 以 完全 描述 上 述 过 程 的 所 谓 能 量 画 数 ， 那 么 系统 
的 稳定 性 问题 就 可 解 次 。 为 此 对 霍 尊 菲尔德 反馈 网 络 定义 了 一 种 能 量 函 数 五 ， 称 为 霍 普 菲 


尔 德 能 量 函数 ， 这 个 已 可 正 可 负 。 但 负 向 有 界 ， 所 以 说 ， 它 是 李 雅 普 诺 夫 函 数 的 一 种 推 
广 ， 是 广义 的 李 雅 普 诺 大 冰 数 。 对 于 连续 到 馈 网 络 的 电路 实现 ， 其 状态 方程 组 为 ; 


da 下 记 
下 三 下 人 人 
当 系 统 达到 稳定 输出 叶 ， 牌 尊 菲尔德 能 量 函 数 定义 为 : 
1 上 此 上 三 1 _ 
匹 = 之， -yy + FT1)d7 (4.18) 
i=1 1 i=i il 


其 中 ， 去 = 了 + 袜 wg ， 风 为 第 /个 给 入 与 第 ;个 输入 之 间 的 连接 导 纳 ， wy = 与 
=1 攻 





分 别 为 第 主 个 运算 放大 器 的 电 阴 和 输入 电容 。 六 为 外 加 电流 ， 志 和 分 别 为 第 ;个 运算 放 
大 器 的 输入 与 和 输出 。 它 们 之 间 的 关系 为 一 个 单调 上 升 的 函数 关系 ， 如 岁 4.11(8) 所 示 ， 其 
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中 及 表示 运算 放大 器 的 放大 伴 数 ， 儿 中 给 出 了 相同 丰 输 入 与 输出 之 间 的 关系 。 

在 能 量 机 数 (4.18) 式 中 , 函数 FICw) 为 下 的 逆 函 数 。 中 为 的 函数 关系 赂 妇 图 4.1Hb) 
所 示 : 能 量 两 数 中 的 积分 项 表示 了 输入 状态 与 输出 之 间 关 系 的 能 量 项 ， 其 积分 结果 如 图 
4.1tfc) 所 示 。 

对 于 理想 设 大 器 ，(4.18) 式 所 和 定义 的 能 量 函 数 可 以 被 简化 为 ; 

BE= -之 weiv， -了 
2 汪 = 1 

这 也 怠 成 了 离散 网 络 的 淮 尊 菲尔德 能 量 函 数 。 





HL 
克 -7 人 nan 





19) fb) 人 
图 4.11 能 最 函数 中 各 丽 数 之 问 的 卫 数 关系 式 
对 于 所 定义 的 稚 交 菲 尔 德 能 基 函 数 《4.18) 式 有 以 下 结论 : 对 于 (4.17) 式 定义 的 CHNN 
模型 系统 ， 若 冰 数 户 = _F 六 二 )》 是 单调 递增 理 连 续 可 徽 ， 则 能 董 函数 《4.18) 式 是 单调 递减 
且 有 界 。 
下 面 首 先 分 析 一 下 能 量 函 数 的 单调 递减 。 已 知 : 
8) Wi 二 镍 荐 。 
b) Fe) 为 单调 递增 连续 函 煞 。 
dd 忆 dE dh 
下 全 由 


-了 |- 2 有 -| 
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; - qd 
出 已 绅 条 件 四 本 得 Fl)z0， 交 因为 C>0， 所 以 有 本 和 0， 





d 
当 生 =0 时 ， 有 4 = 04 12。 7 ， 这 表明 ， 能 量 下 的 极 小 上 与 Ce = 0 的 平生 


di 
点 是 - 致 的 。 
平面 讨论 扎 的 有 界 性 。 这 虫 最 主要 的 是 五 不 能 下 降 到 负 无 穷 大 ,五 在 负 方 向 要 有 界 。 
只 有 这 样 ， 当 五 随 普 时 间 的 增 如 必 完 会 达到 一 个 极限 值 ， 和 而 此 极限 值 正 基 系统 的 稳定 点 。 


全 因为 对 二 状态 和 输出 ， 有 ui|<1，wy 是 由 电子 元 器 件 的 有 界 数组 成 的 。 所 以 巨 中 

















第 一 -项 是 有 界 的 。 
哆 因为 外 加 电流 却 也 赴 有 限 值 。 所 以 五 中 第 二 项 赴 有 办 的 。 


图 对 十 巨 中 第 三 项 ， 式 中 产 -10 反 映 了 神经 网 络 的 状态 与 输出 之 赣 的 关系 ， 也 是 运 
算 放 大 器 的 输入 与 输出 之 间 的 曙 煞 关系 。 着 用 有 代表 运算 区 大 器 的 增益 ， 那 么 让 与 立 的 鞠 
系 可 用 下 = 7 让 瑟 代 替 六 = Fe)， 并 山 此 可 得 记 = 记 P (vi) 。 








由 此 可 得 第 三 项 为 记 弟 ， | 开 +0Dd ， 从 图 41HG) 中 可 以 看 出 ， 上 趟 的 积分 对 一 
并 


FE=] 


此 时 ， 积 分 项 的 作用 很 小 而 可 以 色 略 不 计 ， 能 量 琐 数 就 山 第 一 、 二 两 项 的 和 决定 ， 成 为 离 
散 时 的 情况 ， 有 界 。 如 果 有 比较 小 ， 第 三 项 为 正 ， 它 的 贡献 主要 在 靠近 w = +l 的 边缘 ， 


其 值 总 是 小 于 ?le|， 所 以 也 是 有 界 的 。 


涩 我 们 对 反馈 网 络 应 用 震 普 菲尔德 能 旦 图 数 乒 ， 从 任意 一 个 初始 状态 开始 ， 因 在 等 次 
从 代 厂 者 能 满足 AE<s0， 所 以 网 络 的 能 量 将 会 越 来 越 小 ， 最 后 趋 于 稳定 点 AR =0。 埠 普 
非 尔 德 能 量 函 数 的 物理 意义 足 : 在 闭 些 渐进 稳定 点 的 吸引 域内 ， 离 吸引 点 越 远 的 状态 ， 所 
有 具有 的 能 旦 越 大 , 由 于 能 量 函 数 的 单调 下 降 特 忻 , 保证 状态 的 运动 方向 能 从 远离 吸引 点 处 ， 
不 断 地 趋 于 吸引 点 ， 直 到 达 科 稳 定点。 

几 点 说 明 ; 

全能 量 函 数 是 反馈 网 络 中 一 个 很 重要 的 概念 。 根 据 能 重 函 数 ， 可 以 很 方便 地 判定 系统 
的 稳定 性 。 网 络 的 能 量 值 与 其 状态 存在 着 -- 定 的 联系 ， 即 能 量 的 改变 对 应 着 状态 的 变迁 ， 
网 络 的 稳定 状态 对 应 于 能 量 函 数 的 棚 小 点 。 正 是 这 种 对 应 关系 为 网 络 进行 优化 计算 奠定 了 
基础 。 

也 能 量 函 数 与 李 雅 普 诺 去 函数 的 区 别 在 于 : 棕 兵 函 数 被 限定 在 大 于 零 的 范围 内 ， 而 能 
量 函 数 无 此 要 求 ， 但 要 求 负 向 有 界 ; 李 氏 函数 要 求 在 零点 值 为 稚 ， 划 v(0) = 0， 而 能 量 函 


数 无 此 要 求 ， 所 以 ， 当 能 量 函 数 忆 满足 EO)<0.E(O) =0 和 5 50 时 ， 霍 普 厘 尔 德 能 
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1 


量 函 数 就 是 李 雅 普 诺 夫 函 数 了 。 
仿 霍 普 菲 尔 德 选择 的 能 量 函 数 ， 它 只 是 保证 系统 稳定 和 渐 近 稳定 的 充分 条 件 ， 而 不 是 


必要 条 件 ， 其 能 量 函 数 也 不 是 唯一 的 。 为 了 能 够 使 呈 <0， 牌 普 菲尔德 对 设计 权 wy 有 





一 个 对 称 性 的 要 求 ， 即 wy = wj 秆 全 :> 0 的 要 求 ， 权 的 对 和 要求 与 实际 神经 网 络 的 实验 


情况 并 不 符合 ， 实 际 神经 细胞 之 间 的 连接 没有 对 称 性 要 求 。 不 少 文章 阐述 了 即使 不 满足 连 
接 权 和 矩阵 对 称 的 条 件 ， 仍 然 可 以 达到 系统 的 稳定 。 
4. 4.3 能 量 范 数 与 优化 计算 

所 谓 优化 问题 ， 是 求解 满足 一 定 约 昌 条 件 下 的 目标 函数 的 极 小 值 问题 。 有 关 优化 的 伟 
统 算法 很 多 ， 如 梯度 法 、 单 纯 型 法 等 ， 山 于 在 某 些 情况 下 ， 约 束 条 件 的 过 于 复杂 ， 加 上 变 
量 维 数 较 多 等 诸多 原因 ， 使 得 采用 传统 算法 进行 的 优化 工作 耗 时 过 多 ， 有 的 甚至 达 不 到 预 
期 的 优化 结果 。 

霍 普 菲尔德 能 量 函数 是 一 个 反映 了 多 维 神经 元 状态 的 标量 函数 ， 而 且 可 以 用 简单 的 电 
路 形成 人 工 神经 网 络 ， 它 们 的 互联 形成 了 并 联 计算 的 机 制 。 当 各 参数 设计 合理 时 ， 由 电路 
组 成 的 系统 的 状态 ， 可 以 随时 间 的 变化 ， 最 终 收 敏 到 渐 近 稳定 点 上 ， 并 在 这 些 稳定 点 上 使 
能 量 函 数 达 到 极 小 值 。 以 此 为 基础 ， 可 以 人 为 地 设计 出 与 人 工 神经 网 络 相对 应 的 电路 中 的 
参数 ， 把 优化 问题 中 的 目标 函数 、 约 束 条 件 与 起 普 菲 尔 德 能 量 函 数 联系 起 来 。 这 样 ， 当 电 
路 运行 后 达到 的 半 衡 点 ， 就 是 能 量 函 数 的 极 小 点 ， 其 系统 状态 满足 了 约束 条 件 下 的 目标 函 
数 的 极 小 值 ， 以 此 方式 ， 利 用 人 工 神经 网 络 来 解决 优化 问题 。 由 于 人 工 神经 网 络 是 并 行 计 
算 ， 其 计算 量 不 随 维 数 的 增加 而 发 生 指 数 性 质 的 “爆炸 ”， 因 而 特别 适用 于 解决 有 此 问题 
的 优化 问题 。 

1) 能 量 函 数 设 计 的 一 般 方法 


设 优 代 目标 函数 为 凡 a 有 .2E 玉 ， 为 人 工 神 经 网 络 的 状态 ， 也 是 目标 函 煞 中 的 变量 。 
优化 的 铭 束 条 件 为 : 8(2 信 =0。 优 化 问题 归结 为 : 在 满足 约束 的 条 件 下 ， 使 目标 函数 最 小 。 
军 于 司 以 设计 出 等 份 最 小 的 能 量 函 数 己 为 ， 

五 = 大 (Co， 咏 二 工 |siCGe] 
这 里 ， 也 |giGes 志 也 称 为 惩罚 函数 ， 因 为 在 约束 条 件 Sev = 0 不 能 满足 时 ， 也 si 可 的 
值 总 是 大 于 零 ， 造 成 己 不 是 最 小 。 

对 于 目标 函数 za 由 ， 一 般 总 是 取 一 个 期 望 值 与 实际 值 之 间 之 美的 平方 或 绝对 值 的 标 

量 函 数 ， 这 样 能 够 保证 丸 & 切 总 是 大 于 宪 。 根 据 霍 普 菲 尔 德 能 量 函 煞 的 要 求 ， 只 有 忆 在 负 


的 方向 上 有 界 ， 即 | 天 < 已 。， 同时 宁 <0， 则 系统 最 后 关 能 达到 瑟 最 小 且 5 = 0 的 点 ， 
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此 点 同时 又 是 系统 稳定 点 , 勒 本 = 了 作 的 点 。 由 于 求解 优化 问题 的 巨 往 往 是 状态 的 函数 ， 








所 以 ， 为 了 求解 方便 ， 党 党 将 宁 <0 的 条 件 转化 为 对 状态 求 导 的 条 件 如 下 : 
9ECm) -du (4.19) 
Qi 全 








， ， (2 ， 
du 虹 dd gu- ydduz<0 
起 Qi ， 二 了 du 二 下 


林 以 说 条 件 〈4.19》 式 是 0 的 另 一 种 表达 形式 。 同 理 可 得 另 一 个 等 价 的 条 人 为 


上 


9V， 志 


所 以 在 用 惟 普 菲尔德 能 量 函 数 求 解 优 化 问题 时 ， 首 先 应 把 问题 转化 为 目标 钞 煞 和 约 旧 
条 件 ， 然 后 构造 出 能 量 丽 数 ， 并 利用 条 件 式 来 出 能 量 函 数 中 的 参数 ， 出 此 得 到 人 工 神经 网 
络 的 连接 权 值 。 

2 ) 具体 设计 步骤 

全 根据 要 求 的 且 标 函数 ， 写 出 能 量 函 数 的 第 一 项 Au); 

名 根据 约束 条 件 gu = 0， 写 出 惩罚 函数 ， 使 其 在 满足 约束 条 件 时 为 最 小 ， 作 为 能 
旺 函 数 的 第 二 项 ; 


OFE(Gsvi) Gy 








@@ 加 上 -项 补 二 | FTGD)dm ， 此 项 是 人 为 加 上 的 ， 因 为 在 神经 元 状态 方程 中 ， 存 
0 





在 一 项 -站 ， 它 是 在 人 工 神经 网 络 的 电路 实现 中 廊 生 的 。 为 了 使 设计 出 的 优化 结果 能 够 


在 电路 中 实现 而 加 上 此 项 。 它 是 一 个 正 但 琢 数 。 在 运行 放大 增益 足够 大 时 ， 此 项 可 以 忽略 。 
多 根据 能 量 函 数 王 求 出 状态 方程 ， 并 使 下 式 成 立 : 


喇 - 和 
gb 全 


网 根据 条 件 与 参数 之 间 的 关系 ， 求 出 由 和 访 人 = 1 2 六: 
二 求 出 对 应 的 电路 参数 ， 并 进行 民 拟 电路 的 实现 。 
4.5 用 CHNN 求解 TSP 问题 
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4.5.1 网 络 设计 


霍 普 徘 尔 德 在 80 年 代 初 提出 的 对 反馈 连续 网 路 的 稳定 性 判别 的 能 旦 函数 是 建立 在 能 
量 基 础 上 的 。 同 李 雅 普 诺 大 函数 一 样 ， 翟 普 非 尔 德 认 为 ， 在 系统 的 运动 过 程 中 ， 其 内 部 储 
存 的 能 量 随 着 时 间 的 增 如 而 乏 渐 减少 ， 当 运动 到 平衡 状态 时 系统 的 能 量 耗 尽 或 变 得 最 小 ， 
著 么 系统 自然 在 此 平衡 状态 处 于 渐 近 稳定 。 利 用 能 量 函 数 的 概念 ， 可 以 设计 连续 到 馈 网 络 
进行 优化 计算 。 加 上 连续 型 反馈 网 络 与 电子 线路 之 间 和 存在 着 直接 对 必 关 系 ， 这 样 恕 可 以 方 
便 地 用 大 规模 电子 线路 来 实现 网 络 的 并 行 自 循环 的 运行 。 通 过 这 种 并 行 运算 ， 有 可 能 解决 
优化 计算 中 的 “指数 爆炸 ”问题 。 最 典型 的 应 用 例子 为 TSP 问题 , 即 旅行 尚 问题 : - -个 商 
人 要 在 站 个 城市 中 不 笠 复 地 各 走 一 凯 的 最 短路 径 的 求解 。 

为 了 用 CHIN 米 求 解 TSP 问题 ， 必 须 将 原 问 题 转变 成 烙 学 表达 式 。 下 而 是 常用 的 一 种 
表示 法 。 以 城市 数 W = 5， 代 号 分 别 取 C1、C2、5C3、C4 和 65 为 例 ， 求 解 出 TSF 的 解 可 能 
形式 比如 为 : C1-C4-C2-0C5-C3。 采 用 拖 阵 表达 ， 可 用 行 坟 示 城市 ， 列 表示 人 位置， 其 解 可 表 
示 为 如 表 4.2 所 示 。 








表 4.2 TSP 解 的 一 种 矩阵 表示 形式 


























由 家 4.2 可 得 ，TSP 问题 的 可 行 解 必须 满足 以 下 三 个 条 件 : 

吕 每 行 有 且 只 有 一 个 1: 

名 每 列 有 且 只 有 一 个 1; 

多 1 的 总 数 必 须 等 于 城市 数 〔N)。 

注 足 以 上 三 个 条 件 的 解 为 有 效 解 ， 路 程 最 短 的 有 将 解 为 问题 的 最 优 解 . 

采用 CHNN 解 TSP 问题 的 一 般 解 表达 式 的 形式 可 表示 如 下 。 对 于 站 个 城市 ， 需 要 请: 个 
神经 元 ， 神 经 元 的 输入 记 为 : 蕊 =[ 下 ， 偏 差 记 为 : 了 = 轩 导 江 ， 和 输出 记 
为 : 外 =[m 和 7 。 神 经 无 输出 Y 的 意义 如 表 4.3 所 示 。 

硬件 实 贡 的 神经 无 出 模拟 运算 放大 器 和 电 赛 、 电 阻 构 成 ， 运 算 放 大 露 的 输入 输出 特性 
用 激活 阴 数 8i = 二 (+ tanh(hui 为 表示 ， 4 称 为 增益 参数 。 各 神经 元 之 间 的 联接 用 联接 矩阵 


7 表示。 此 外 ， 各 神经 元 的 时 间 常数 记 为 =RC ， 可 简化 为 统一 的 常数 二 。 括 还 CHNN 
的 动态 方程 如 下 : 














属 =7 了 .V-UAr+7 (4.20) 
59 


VY =[L+tanh(4.DJA2 [4.211 


表 4.3 "个 神经 元 网 络 解 出 TSP 的 过 现形 式 


























本 节 的 主要 目的 是 末 用 软件 来 实现 CHIN， 并 用 其 名 次 TSP 问题 
为 了 用 数字 计算 机 仿 起 硬件 网 络 的 动态 运行 过 程 ， 必 须 对 这 进行 积分 。 因 此 ， 将 
《4.20) 式 改写 如 下 : 


AU =(7TY 一 DAr+ 门 .和 《4.22) 


好 必须 足够 小 ， 这 样 才能 用 下 式 计 算 下 一 时 刻 的 输入 
LGA)=t 人 +AE 《4.23 ) 
上 友 复 用 (421) 式 、 (4.22) 式 和 (423)》 式 进行 选 代 ， 网 络 最 终 能 到 达 一 个 稳定 的 
状态 ， 该 状态 就 对 应 着 问题 的 一 个 解 。 而 和解 的 有 效 性 和 最 优 性 是 由 所 谓 的 能 量 函 数 来 保证 
的 。 


工 1 1] rr - 
5 
Ai 


其 中 ， si = 了 了 G+tanh(lui。 


上 式 中 ， 第 三 项 是 由 于 放大 器 造成 的 ， 当 4 很 大 时 ， 它 的 作用 可 以 和 忽略， 我们 只 要 根 
据 前 两 项 来 构造 能 量 函 数 即 可 。 针 对 用 表 4.3 中 提出 的 表示 形式 ， 可 构造 出 能 量 函 数 为 : 


Er- 人文 冤 w+ 2 下 [这 呈 


2 筷 过] 上 关 广 ] xl ?=1 1 = 


号 (4.25) 


+ 六 yd 罗 wu wyir 十 Vy j 


= =1 1 
了 天 


其 中 ，4,B,C, 都 是 正 数 ， 其 意义 如 下 ; 4 称 为 行 抑制 系数 ， 它 次 定 行 抑 制 的 程度 ， 吾 
称 为 列 换 制 系数 ， 它 诀 定 列 抑制 的 程度 ，C 称 为 全 局 抑制 系数 ， 它 次 定 全 局 抑制 的 程度 ; 


了 称 为 距离 抑制 系数 ， 它 决定 距离 抑制 的 程度 ， (do jwxn 是 个 城市 问 的 距离 抵 阵 。 


pe 下 iis-urictpi 二 Yirirrrrrmerrre 一 ， 





治 网 络 运行 到 -个 稳定 状态 时 ， 网 络 的 输入 和 输出 应当 保持 不 变 ， 即 
A =EG+A 一 TO=0 
这 样 ， 终 态 的 划 断 条 件 可 以 选 作 : 
IaX taujss 
1 FS 
e 是 一 个 任意 小 的 正 数 。 
根据 (4.24)》 式 、(4.25) 式 可 以 推导 解 出 最 优 艇 的 网 络 权 值 的 联接 敌阵 为 : 
Troc-DrintyrDry =-4620-6r)-B6rd-5o)-C-Ddu(GiDI+GIED (426) 
其 中 ，zy 表示 城 市 ; 站 了 表示 路 径 中 的 位 秆 :了 呈 一 个 思维 的 对 称 方 阵 ; 
司 ;= ] ， 
2 0 ，iz7 
正大 因为 在 软件 设计 中 需要 考虑 这 些 特殊 问题 ， 所 以 在 下 面 几 节 内 容 中 将 分 别 对 有 关 
问题 进行 讨论 。 


4.5.2 对 终 态 时 系统 的 输出 向 量 的 解释 


所 谓 对 终 态 时 的 笨 册 向 旧 乡 进行 解释 是 指 : 将 表 4.3 的 表示 形式 转换 为 对 应 的 路 么 。 
路 径 用 一 个 行 向 量 尺 =[, 瑚 ,站 表示 ， 如 对 4 座 城市 的 情况 ， 一 种 可 能 的 路 径 为 ; 
让 [2 1 4 3 ， 它 表示 实际 的 路 线 为 ， 2 一 1 一 4 一 3->2 【箭头 的 方向 也 可 首 转 ) 。 

出 于 0 过 六 们 1， 因 此 采用 以 下 的 方法 来 对 终 态 时 的 输出 向 星 进 行 解释 :， 找 出 表 4.3 
中 每 行 中 的 最 大 值 以 及 其 所 在 的 列 数 .六 该 列 数 了 表示 城市 将 出 现在 路 丢 的 第 了 个 位 置 
上 ,， 令 局 = 从 而 得 到 路 径 癌 量 。 售 找 的 顺序 古 竺 行内 从 左 到 右 ， 对 城市 采用 从 上 到 下 。 

由 此 产生 一 个 问题 :这样 能 保证 每 一 行 的 最 大 值 都 会 出 现在 不 同 的 列 上 吗 ? 竹 案 足 
否定 的 。 一 个 很 自然 的 想法 是 : 再 对 列 作 相同 的 和 操作。 然而， 如果 对 行 和 列 的 操作 不 相符 ， 
就 必须 采取 一 种 策略 来 进行 取舍， 这 种 取舍 必须 兼顾 别 的 行 和 列 ， 这 样 一 末 ， 仅 仅 在 对 结 
果 的 解释 上 就 花费 了 相当 长 的 时 间 ， 从 而 增加 了 厢 个 算法 的 时 间 复 杂 度 ， 因 而 这 种 策略 十 
不 可 取 的 。 事 实 土 ， 遂 过 对 能 量 函 数 的 分 析 可 以 看 出 ， 非 有 效 解 的 存在 是 必然 的 。 根 所 
《4.25) 式 ， 前 三 项 保证 终 态 时 邱 的 每 行 、 每 列 有 且 只 有 一 个 1， 并 县 1 的 总 数 等 于 m 
第 四 项 的 意义 在 于 : 在 前 三 项 的 基础 上 上 ， 上 距离 最 短 的 路 径 对 应 着 能 量 函 数 的 最 低 点 。 但 中 














1 1 - ， 
由 于 "是 连续 的 ， 加 上 提 线 性 项 元 之 丰 8 (wo)dv 的 影响 ， 使 得 第 由 项 会 产生 一 些 剖 


作用 : 前 三 项 的 略微 增 大 可 能 导 殖 第 四 项 的 显著 减 小 ， 从 而 使 得 整个 能 量 函 数 减 小 。 也 就 
是 说 ， 在 能 量 空间 中 ， 能 量 函 数 不 仅 在 有 效 解 处 存在 极 小 值 ， 而 且 在 某 些 砷 有效 解 处 也 存 
在 被 小 值 。 例 如 ， 终 态 时 输出 向 量 出 表 4 4 所 示 (2 = 4， 暂 时 取 4= 中 =C=r=2)。 按 
照 取 每 行 最 大 值 的 方法 ， 对 此 结果 的 解释 是 : [1 2 4 0]， 这 是 一 个 非 有 效 解 。 与 此 邻近 
的 一 个 有 效 解 是 [1 2 4 3 ]， 其 对 应 的 终 态 输出 向 量 风 表 4. 5。 

设 由 表 4. 4 按 (4 .25) 式 算得 再， 护 表 45 算 得 E2 ， 则 : 
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具 开 = 尼 1 一 已 ? 一 1.2 一 D.8d13 十 好 53 一 0.7G34 











车 取 da=os=1，=0.2， 则 AE=-0.1， 避 见 该 非 有 效 解 在 能 量 函 数 空间 中 对 应 的 值 
比 该 有 效 解 的 对 应 值 要 小 ， 非 育 效 解 对 应 的 状态 可 以 是 稳定 的 ， 对 诬 也 一 个 局 部 极 小 值 ， 
从 而 可 能 出 现在 终 态 。 


素 4.4 网 络 终 态 时 输出 向 量 情形 之 一 表 4.5 网 络 终 态 时 输出 向 量 情形 之 二 
位 置 






































显然 ，4,B,c.P,dz 会 影响 非 有 效 解 的 出 现 。 距 离 矩 阵 (day)mxm 由 具体 问题 决定 ， 它 


对 非 有 效 解 的 影响 可 以 通过 调节 4, 部 局 也 的 取 值 米 补偿 。 实 验 表明 ， 一 组 合适 的 4 怠 
忆 卫 参数 能 大 大 减 小 非 有 效 解 出 现 的 几率 。 此 外 ， 由 对 称 性 可 知 ， 小 如 通常 相等 ， 这 样 
待 调 参数 就 减少 为 3 个。 针对 非 有 效 解 的 出 现 ， 我 们 对 终 态 输出 的 解释 采用 了 以 下 的 处 理 
方法 ， 如 果 终 态 出 现 了 非 有 效 解 ， 则 让 系统 拣 复 到 初始 状态 重新 运行 。 实 际 上 参数 的 选取 
对 获得 问题 的 满意 解 十 分 重要 ， 而 这 些 参数 有 时 因 不 同 问题 而 异 ， 尤 其 是 对 城市 数 器 很 敏 
感 ， 这 在 后 而 将 进行 讨论 。 





4.5.3 用 CHNN 算法 实现 TSpP 的 问题 探讨 


1) 软件 算法 内 存 占用 量 

对 于 = 个 城市 的 情况 ， 联 接 矩 阵 了 的 维 数 是 严 x 子 ， 神 经 网 络 的 输入 、 输 出 以 及 偏差 
都 是 子 X1 的 向 量 。 可 见 ， 这 种 算法 的 内 简 占用 量 很 大 。 同 时 ， 旦 于 程序 采用 大 量 的 矩阵 
运算 ， 因 此 ,内存 占用 量 的 增加 必 将 导致 时 间 用 量 的 增加 。 实 验 显 示 ， 对 于 az15 的 情况 ， 
求 出 一 个 解 的 时 间 相 当 长 。 

生物 神经 网 络 能 在 很 短 的 时 间 内 解决 一 些 计算 机 票 花 间 很 长 时 间 才 能 解决 的 问题 ， 
其 中 一 个 最 重要 的 原因 是 并 行 计算 的 机 制 ， 另 一 个 重要 的 原因 是 用 模拟 式 计算 而 不 是 数字 
式 计 算 。 模 拟 式 计 算 在 精确 性 上 不 如 数字 式 计 算 ， 但 是 在 诸如 TSP 这 类 优化 问题 上， 精确 
的 计算 似乎 并 不 重要 ， 它 反而 会 增 大 求解 的 时 间 :， 模 拟 式 计算 具有 的 模糊 性 能 达到 同时 考 
虑 多 种 可 能 决策 的 效果 ， 因 此 在 解决 诸如 TSP 这 类 优化 问题 上 有 很 高 的 效率 。 上 此外， 神经 
元 之 间 大 量 的 相互 连接 也 为 它 的 强大 的 计算 能 力 提 供 了 帮助 。 大 量 的 相互 连接 使 得 原本 独 
立 的 计算 单元 (神经 元 ) 之 闻 建 立 了 广泛 的 联系 ,使 得 原本 互相 独立 的 计算 过 程 相 互 影 响 ， 
共同 求 得 问题 的 解 。 和 霍 普 菲 尔 德 提出 CHNN 的 目的 就 是 模仿 生物 神经 网 络 ， 设 计 测 -一 种 大 
规 异 相互 连接 的 、 上 共有 并 行 计 算 能 力 的 、 由 模拟 元 件 组 成 的 人 工 神经 网 络 。 这 种 神经 网 络 
对 于 TSF 这 类 优化 问题 具有 很 强 的 求解 能 力 ， 布 旦 这 种 网 络 求解 TSP 问题 所 需 的 时 间 是 其 
元 件 时 间 常 数 的 儿 倍 。 
售 





























事实 上 用 软件 仿真 的 目的 ， 我 们 认为 主要 有 以 下 几 点 : -是 验证 理论 的 可 行 性 ， 即 
对 (4.20》 式 、(4 21) 式 所 表示 的 人 于 神经 网 络 能 否 求解 TSP 这 类 问题 的 检验 ， -是 观 
察 … 些 参数 对 求解 过 程 的 影响 ， 从 而 为 设计 硬件 电路 提供 一 定 的 指导 ; 三 是 利用 计算 机 对 
CHNN 作 一 些 理论 上 的 分 析 。 至 于 软件 模 扳 的 时 间 和 内 存 占 用 基 并 不 共有 重要 的 意义 。 原 
四 很 简单 ， 单 机 上 的 软件 模 氢 不 具有 并 行 计 算 的 特点 ， 仅 具有 半 横 拟 计 算 的 特点 ， 因 为 计 
算 机 在 计算 的 过 程 中 采 记 的 此 数字 的 逮 辑 的 方式 ， 特 别 是 对 于 积分 等 运算 : 但 是 ， 相 对 于 
别 的 基于 接 索 的 优化 算法 而 言 ， 这 神 模 拟 的 算法 具有 一 定 的 “模拟 性 ”， 负 为 它 是 模拟 一 
个 动态 过 程 从 不 稳定 “运行 ”到 稳定 后 获得 解 ， 它 不 像 基 于 搜索 的 算法 都 磁 需要 精 傅 地 计 
算出 中 间 状 态 ， 从 这 个 意义 上 说 它 具 有 “ 半 模 拟 性 *， 并 且 从 其 内 部 的 计算 过 程 米 说， 和 
也 不 具有 生物 神经 网 络 所 具有 的 计算 单 扼 之 间 的 相互 作用 。 因 此 ， 软 件 仿真 存 时 间 和 内 人 存 
占用 量 上 是 不 可 少 的 。 也 许 用 并 行 计算 的 方法 编程 会 有 所 改观 。 

2)》 在 连续 的 状态 空间 内 求解 离散 状态 问题 


在 能 晶 函 数 〈4. 25) 中， 如果， =0 或 ] ， 那 么 在 这 个 离散 的 状态 空间 上 能 量 郑 数 如 


的 局 部 极 小 值 对 应 每 一 个 有 效 解 ， 并 且 在 最 优 路 入 上 取得 全 局 极 小 值 、 如 果 0sva sl， 
那么 在 这 个 连续 的 状态 空间 上 能 量 函 数 有 的 局 部 极 小 值 不 仅仅 对 应 着 有 北 解 ， 还 可 能 对 应 
着 一 些 非 有 效 解 。 显 然 ， 能 量 函 数 E 的 局 部 极 小 值 与 有 效 解 之 问 的 非 一 对 应 关系 导致 了 
问题 求解 过 程 中 非 有 效 解 的 出 现 ， 并 且 也 会 使 求解 的 过 程 花 费 更 多 的 时 间 。 于 是 ， 一 个 很 
自然 的 想法 是 : 如 果 将 激活 函数 选 为 硬 函 数 ， 邦 么 ve 号 被 限制 在 0 或 1 上 ， 这 样 能 否 减 
少 非 有 葡 解 的 出 现 并 且 使 求解 时 间 缩 短 ? 答案 是 育 定 的 。 下 而 号 这 方面 的 实验 。 

为 了 便于 研究 参数 对 求解 过 程 的 影 啊 以 及 CHNK 算法 的 优 乃 。 我 们 所 实现 的 主 程序 有 
3 个 版 本 ， 分 别 取 名 为 : tspmainl、tspmain2、tspmain3， 主 要 区 别 在 于 激活 函数 户 不 同 ， 





















































依次 分 别 为 : 万 = 了 了 +rtanh(hui)、 捕 =logsign(hz 和 大 -了 +signtu))， 


取 城 市 数 详 从 3 到 10， 分 别 运行 tspmain1、tspmain2、tspmain3， 记 录 它 们 求 得 
一 个 有 效 解 所 用 的 时 间 ， 作 出 时 间 随 “ 的 变化 利 线 〈 列 图 4 12)。 周 4.12(a) 是 三 种 不 隔 
的 激活 函数 分 别 对 应 的 求解 时 间 与 城市 数 日 的 关系 曲线 。 图 412( 人 pb) 是 三 种 激活 函数 所 求 
得 的 最 复 路 程 的 比较 。 应 当 注 意 的 是 ， 访 网 中 只 有 横 公 标 相同 的 点 才 有 订 比 性 〈 音 位 为 城 
市 数 m) 。 因 为 城市 数目 不 同时 距离 矩阵 也 不 同 。 图 4.12(e) 是 三 种 激活 函数 形状 的 比较 。 
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图 4. 12 二 种 不 间 的 激活 函数 的 性 能 对 比 图 
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从 图 4.12(aj 和 图 4.12 (b) 两 幅 图 来 看 ， 似 乎 醒 冰 数 的 求解 效率 最 高 ， 因 为 它 所 需 的 
时 间 最 每 ， 且 所 求 出 解 的 质量 也 不 比 其 他 两 种 激活 函数 时 的 情况 差 。 但 在 做 这 个 实验 时 ， 
发 现 当 激 活 函 数 用 全 函数 时 ， 程 序 有 时 会 陷入 死 循 环 ， 而 其 他 的 激活 函数 则 不 会 出 现 。 图 


中 还 可 以 看 出 ， 采 用 看 函 数 后 求解 时 间 变 短 。 当 函数 8 = 了 + enh(a) 中 增益 参数 


1 一 o 乒 ， 它 就 等 价 于 硬 通 数 ， 这 祥 似 乎 增益 参数 越 大 ， 求 解 过 程 越 快 ， 可 见 找到 一 个 满 
意 的 增益 参数 对 于 提高 求解 效率 殷 重 要 。 但 是 在 使 用 tspmain3 的 过 程 中 ， 我 们 发 现 求 得 
的 解 可 能 是 任意 的 ， 从 统计 角度 而 言 ， 它 得 到 的 解 比 其 他 两 种 方法 得 到 的 解 要 差 ， 即 距离 
大 。 此 时 对 于 TSP 这 种 优化 问题 ， 求 “最 优 解 ” 的 目标 已 被 降低 为 求 “ 次 优 解 ”， 这 是 符 
合 实际 需要 的 。 不 过 在 这 种 前 握 下 ， 所 获 竺 的 平均 丰 离 的 大 小 应 当成 为 衡量 算法 好 坏 的 一 
个 重要 标准 。 因 此 ， 求 解 效率 是 一 个 综合 指标 ， 它 包括 求解 时 间 、 所 获得 的 于 均 距 离 的 大 
小 和 非 有 效 解 出 现 几 率 三 方面 因素 。 在 离散 状态 空间 中 求解 TSP 这 类 问题 所 需 的 时 间 较 
短 ， 按 和 霍 普 菲 尔 德 的 说 法 ， 在 离散 状态 空间 中 求解 得到 的 结果 比较 接近 于 随机 生成 路 径 的 
结果 。 在 状态 空间 中 求解 TSP 这 类 问题 所 需 的 时 间 较 多 ， 同 时 次 优 解 出 现 的 机 会 较 多 ， 状 
态 的 连续 性 类 似 于 模糊 理论 中 的 隶属 度 ， 它 使 同时 考虑 各 种 情况 成 为 可 能 。 增 益 参 数 14 能 
控制 激活 孙 数 非 线性 部 分 的 斜率 ,因此 很 重要 。 目 前 我 们 觉得 取 1 一 5 较 好 。4 = 0.5，0. 6， 
0.7，0.8，0.9，1，5，10，20，30，40，50，60，?70，80，90 时 对 求解 时 间 的 影响 见 图 
4. 13。 





























图 4. 13 么 对 求解 所 需 时 间 的 影响 


4.5.4 各 参数 的 影响 


I 初始 值 的 选取 

求解 网 络 动态 方程 ， 必 须 有 初始 值 v6 。 初 始 值 的 选取 有 以 下 两 种 方法 : 一 是 随机 远 
取 ， 另 一 种 是 取 一 常数 向 量 芯 ， 使 得 习 wxi = 开 5(L+tanh(.Do)=， 然后 给 Do 一 个 随 
机 扰动 i ， 以 wo + 作为 初始 值 。 经 我 们 试验 ， 这 种 方法 比 第 一 种 方法 好 。 通 过 实验 ， 


我 们 将 初始 合 定 为 一 个 常数 ， 它 具有 如 表 4 6(a) 所 示 的 形式 ， 使 得 开始 计算 时 网 络 输出 了 
县 有 表 4.6 人 b) 的 形式 。 这 样 保证 了 网 络 开 始 时 一 定 处 于 不 稳定 状态 。 然 后 再 给 初始 值 一 
个 小 挑动 -0.1.max(ro)smax(Bb)<s01.maxG0) ， 使 网 络 运动 起 来 。 


表 4.6(a) 表 4.6(b) 





2) 仿 差 7 对 求解 过 程 的 影响 

了 的 影响 主要 是 使 能 董 函数 室 间 中 局 部 楼 小 值 处 的 变化 率 增 大 ， 也 和 就 是 锐 化 能 量 函 数 
空间 。 按 了 的 取 值 计算 10 次 ， 记 下 结果 中 有 效 解 平均 所 需 时 间 ( 见 图 4. 14(a) , 维 坐 标 单 
位 为 秒 ) 以 及 10 次 结果 中 非 有 效 解 个 数 ( 见 图 4. 14(b)), 图 中 横 举 标 为 志 

下 图 4. 14 可 扣 ，7 取 太 小 或 太 大 都 不 好 ， 不 仅 时 间 花 费 大 ， 而 且 错 误 率 高 。 从 实验 
中 得 知 ， 工 的 可 取 范 围 为 30 一 50。 





























立 4. 14 有 效 解 平均 所 需 时 间 次 结果 中 非 有 效 散 个 数 
以 上 实验 统一 使 用 表 4.? 中 括号 外 所 列 的 参数 值 ， 十 通过 实验 和 分 析 获 取 的 。 


表 4.7 实验 中 所 用 各 参数 取 值 表 
CTorhn 和 li lian 
3 和 芭 参 数 的 选取 
甘于 4 有 3. 已 呈 的 取 值 ， 主 要 是 根据 它们 的 意义 来 调节 : 此 外 ，4= 有 下，CSDDSA4 甩 


的 


可 以 作为 参考 条 件 。 在 实验 中 通过 实际 参数 调节 和 对 比分 析 ， 我 们 做 了 对 于 世 座 城 市 进 
行 TSP 软件 优化 求解 的 工作 ， 采 用 表 4. ? 括号 中 所 列 的 参数 值 。 优 化 求解 所 得 到 的 较 好 以 
及 最 好 的 3 个 结果 如 图 4. 15 所 示 ， 实 验 数据 记录 在 表 4.8 中 。 实 验 是 在 下 述 条 件 进 行 的 ， 
编程 环境 ，MATLAB 5. 21;， 操 作 系统 : 由 ndows 98; 硬件 系统 :Pentium II 233 MK， 内 
存 128M。 刺 市 间距 离 甜 阵 和 城市 坐标 见 表 4. 9 和 表 4. 10。 





fa) 作 + {c+ 


图 4. 15 采用 雷 普 非 尔 德 连续 网 络 优化 求解 10 座 城市 的 TSP 问题 的 结果 图 
表 4.8 实验 数据 记录 


表 4.9 10 座 城 市 间距 高 矩阵 


们 一 Tag Ta [Tag [onlgTr35 [7a50 Te Ta [250 | 
sa | | 70037 6858 |7.5636 |5.0608 [62408 79496 5 2629 | 6.8599 
3473 [0057 0 |57078 [8273 [962L | 3926 | 2 8584 |33794 [47684 | 
66 ”| 66zlg | 57078 |0 | 25928 |5.245L | 8 上 
5 [7 5636 | 8273 |2 .5956 |760n2 [831 10865 [9 7046 |36591 














4.3322 | 5 .0608 [1953T |5.2461 |76013 [0 |3.3193 |3.5662 |23116 |15935 
[25l9 [6as08 | 3926 |85529 | 83L [33 的 0 23407 | 1162|79072 
[as8z | 7996 | 38684 | 4549 | 10965 | 9.5682 |23407 0 |27999 |75797 | 
5. 和 9 人 委 上 5 天 罗 二 33794 74773 [9 7046 | 23116 | Liglz |27993 |0 |68916 
人 7684 GE 







表 4 10 10 座 城 市 坐标 xy7 


了 0 
9. 2622 | 5.4342 1.8699 9. 3422 | 7. 5679 
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gt -HP hr 


4. 5.5 小 结 


总 的 来 说 ， 采 用 CHNN 软件 实现 TSP 足 可 行 的 ， 但 存在 以 下 一 些 不 足 : 

全 空间 占用 量 大 ， 花 费时 间 比 较 多 (主要 是 因为 矩阵 维 数 太 大 ， 计 算 耗 时 多 ) ， 因 此 ， 
未 能 解决 城市 数目 多 的 问题 ， 对 于 10 个 以 内 的 问题 求解 还 比较 理想 ; 

名 可 调 参 数 多 ， 难 以 进行 优化 ; 

坊 可 能 得 到 非 有 效 解 。 

可 能 的 改进 方法 有 : 

人 改进 能 量 函 数 的 形式 ， 以 避免 这 里 遇 到 的 一 些 问题 ， 如 联接 和 托 阵 维 数 大 、 存 在 非 有 
效 解 等 。 已 有 学 者 提出 了 TSP 问题 的 不 同 表 示 形 式 ， 并 构造 出 了 新 的 能 量 函 数 ; 

包 采 用 并 行 的 程序 设计 方法 ， 实 现 并 行 计算 : 

塌 对 于 城市 数目 多 的 问题 ， 可 以 分 级 计算 ， 即 先 将 = 个 城市 的 问题 化 为 严 (mm < 站) 
个 城市 群 米 计算 出 宏观 上 的 最 优 路 径 ， 再 对 每 一 个 城市 群 进行 计算 ， 求 出 微观 上 的 最 优 路 
径 。 应 注意 的 是 宏观 和 微观 的 算法 略 有 不 同 ， 因 为 只 有 在 最 顶层 才 娄 求 最 短 的 闭合 回路 ， 
其 他 层次 上 求 的 是 两 点 之 间 的 最 短路 径 。 
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第 5 章 自 组 织 竞 争 人 工 神 经 网 络 


在 实际 的 神经 网 络 中 ， 比 如 人 的 视网膜 中 ， 存 在 着 一 种 “ 侧 抑制 ” 现 象 ， 即 一 个 神经 
细胞 兴奋 后 ， 通 过 它 的 分 支 会 对 周围 其 他 神经 细胞 产生 抑制 ， 这 种 侧 抑制 使 神经 细胞 之 馈 
出 现 竞争 ， 昌 然 开 始 阶段 各 个 神经 细胞 都 处 于 程度 不 同 的 兴奋 状态 ， 由 于 侧 抑制 的 作用 ， 
各 细胞 之 间 相 互 竞争 的 最 终结 果 是 : 兴奋 作用 最 强 的 神经 细胞 所 产生 的 抽 制 作用 成 胜 了 它 
周围 所 有 其 他 细胞 的 抑制 作用 而 “ 感 ” 了 ， 其 周 国 的 其 他 神经 细胞 则 全 “ 输 ” 了 。 

自 组 织 竞争 人 工 神 经 网 络 正 是 基于 上 述 生 物 结构 和 现象 形成 的 。 它 能 够 对 输入 异 式 进 
行 自 组 织 训练 和 判断 ， 并 将 其 最 终 分 为 不 加 的 类 型 。 与 BP 网 络 相 比 ， 这 种 自 组 织 自 适应 
的 学 习 能 力 进一步 拓宽 了 人 工 视 经 网 络 在 模式 识别 、 分 类 方面 的 应 用 ， 此 外 ， 竞 争 学 习 网 
络 的 核心 一 一 觉 争 层 , 又 十 许多 种 其 他 神经 网 络 模型 的 笠 要 组 成 部 分 ,例如 科 荷 伦 (Kohonenm) 
阅 络 “又 称 特 性 图 )、 友 传 网 络 以 及 自 适应 共振 理论 网 络 等 中 均 包 含 竞争 层 。 














5.1 几 种 联想 学 习 规 则 


格 劳 斯 贝 格 〈《S. Grossberg) 提出 了 两 种 类 型 的 神经 元 模型 : 内 星 与 外 星 ， 用 以 解释 人 
类 及 动物 的 学 习 现 象 。 一 个 内 星 可 以 被 训练 米 识 别 一 个 矢量 ;而 外 星 可 以 被 训练 来 产生 矢 
量 。 


山上 个 输入 梅 成 的 烙 劳 斯 贝 格 内 星 模型 如 图 $.1 所 示 。 





尼 / 
己 ? 


己 ; 





有 P 


图 $.1 格 劳 斯 贝 格 内 是 模 型 图 


由 z 个 输出 节点 构成 的 格 埃 斯 贝 格外 星 横 型 如 图 5.2 所 示 。 

从 图 5.1 和 图 5.2 中 可 以 清楚 地 看 出 , 内 星 是 通过 联接 权 矢 量 Wf 接受 一 组 输入 信号 P; 
而 外 星 则 是 通过 歌 接 权 矢量 向 外 输出 一 组 信号 4。 它 们 之 所 以 被 称 为 内 星 和 外 星 ， 主 要 是 
因为 其 赔 络 的 结构 像 星 形 ， 且 内 旦 的 信号 流向 星 的 内 部 ， 而 外 星 的 信和 号 流向 星 的 外 部 。 下 
面 分 别 详细 讨论 两 种 神经 元 异型 的 学 习 讽 则 及 其 功效 。 





网 52 格 劳 斯 贝 格外 星 模型 图 


5.1.1 内 星 学 习 规则 





实 贡 内 星 输入 /输出 转换 的 激活 函数 是 硬 限制 函数 。 可 以 通过 内 星 及 其 学 习 规 则 来 训 
练 某 一 神经 元 节点 只 响应 特定 的 输入 矢量 PP， 它 是 借助 于 调节 网 络 权 矢 量 证 近似 于 输入 
失 量 己 来 实 葛 的 。 
在 图 5.1 所 示 的 单 内 星 中 对 权 值 修正 的 格 劳 斯 贝 格 内 星 学 习 规则 为 : 
Am =1r(P) 一 起 G，7= 2 (5.0) 


由 《5.1》 式 可 见 内 是 神经 元 联接 强度 的 变化 。 Awlj/ 足 与 输出 成 正比 的 。 如 果 内 星 笨 
出 z 被 某 一 外 部 方式 设置 而 维护 高 值 时 ， 那 么 通过 不 断 反 复 地 学 习 ， 权 和 值 将 能 够 逐渐 趋 近 
于 输入 矢量 户 的 值 ， 并 趋 使 Awl) 逐渐 减少 ， 直 至 最 终 达到 wlj = pj ， 从 而 使 内 星 权 矢 量 
学 习 了 输入 矢量 P， 达 到 了 用 内 星 来 识别 一 个 矢量 的 目的 。 另 一 方面 ， 如 果 内 星 输出 保持 
为 低 值 时 ， 网 络 权 矢 量 被 学 习 的 可 能 性 较 小 ， 甚 至 不 能 被 学 习 。 

现在 来 考虑 当 不 同 的 输入 矢量 忆 和 2 分 别 出 现 在 同一 内 星 时 的 情况 。 首 先 ， 为 了 训 
练 的 需要 ， 必 须 将 每 一 输入 矢量 都 进行 单位 归 一 化 处 理 ， 即 对 每 一 个 输入 矢量 P4 (4 = 1， 
3) 用 | 到 去 天 每 一 个 办 和 元素， 因此 所 得 的 用 来 进行 网 结 庆 的 新竹 入 估量 

=1 


具有 单位 1 的 模 值 。 
当 第 一 个 矢量 己 输 入 给 内 星 后 ， 网 络 经 过 训练 ， 最 终 达 到 厂 =(P)  。 此 后 ， 给 内 星 


输入 另 一 个 输入 矢量 请 ， 此 时 内 星 的 加 权 输 入 和 为 新 矢量 号 与 已 学 习 过 矢量 矣 的 点 积 ， 
妈 























六 = 克 . 忆 
=(PIT .PP2 =|2 下 esesen =cosbl2 
因为 输入 矢量 的 模 已 被 单位 作为 1， 所 以 内 星 的 加 权 输 入 和 等 于 输入 和 失 量 呈 和 总 之 


闻 夹 角 的 余弦。 
根据 不 同 的 情况 ， 内 星 的 加 权 输 入 和 可 分 为 如 下 几 种 情况 : 


(9.2) 
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一 1 


人 请 等 于 让 ， 到 有 0 =0， 此 时 ， 内 星 加 权 输 入 和 为 1 

全 性 不 等 于 下， 随 痊 天 癌 者 下 离 开 方向 的 移动 ， 内 昔 加 权 输 入 和 将 这 渐 减少 ， 直 
到 天 与 虽 矢 直 ， 节 ga = 9%0 时 ， 内 星 如 权 输 入 和 为 0 

护 当 有 王 = 一 站 即 ga= 180 时 ， 内 星 如 权 和 输入 和 达到 最 小 值 -1。 

由 此 可 艳 ， 对 于 一 个 已 训练 过 的 内 旦 网 络 ， 尖 输入 端 再 次 出 现 该 学 习 过 的 输入 矢量 
时 ， 内 星 产 生 1 的 如 权 输 入 和 和 : 多 与 学 习 过 的 失明 不 相同 的 输入 出现 时， 所 产生 的 加权 输 
入 和 总 是 小 于 1。 如 果 将 内 星 的 址 权 输 入 和 送 入 到 一 个 具 丰 略 大 于 -1 偏差 的 -一 值 型 激活 函 
数 ， 对 于 一 个 忆 学 习 过 或 接近 了 丁 吕 学 习 过 的 矢量 输入 ， 同 样 能 够 使 内 星 的 输出 为 1， 而 其 
他 情况 下 的 输出 均 为 0。 所 以 在 求 内 星 加 权 输 入 和 公式 中 的 权 值 多 与 输入 矢量 严 的 点 积 ， 
反映 了 和 输入 撩 暴 与 网 络 权 失 上 基 之 间 的 相似 度 ， 当 相似 度 接 近 1 时 ， 表 明 输入 矢量 已 与 权 
矢量 相似 ， 并 通过 进一步 学 习 ， 能 够 使 权 失 号 对 其 输入 矢量 具有 更 大 的 相似 度 ， 当 多 个 相 
似 输入 矢量 输入 内 星 ， 最 终 的 训练 结果 是 使 网 络 的 权 矢 量 趋 向 于 相似 输入 矢量 的 半 均 值 。 

肉 星 网 络 中 的 相似 度 是 由 偏差 坊 膝 控制 的 ， 出 设计 者 在 训练 前 选 定 ， 典 型 的 相似 度 值 
为 五 = -0.95， 这 意味 着 输入 和 失 旦 与 权 拓 旺 之 间 的 光阴 小 于 18"”48'。 若 选 近 -09 时 ， 则 其 
衰 基 扩大 力 25”48'。 

一 层 具 有 个 神经 元 的 内 星 ， 可 以 用 相似 药方 式 进行 训练 ， 权 和 值 修正 公式 为 ; 

Awy 三 开 '(PD) 一 AQ (3.3) 

一 - 层 = 个 肉 星 神经 元 可 以 作为 一 个 > 到 上 的 解码 器 。 另 外 ， 内 星 前 常 被 嵌 在 具有 外 星 
或 其 他 元 件 构成 的 大 规模 网 络 中 ， 以 达到 某 种 特殊 的 己 的 。 内 旦 网 络 常用 在 竞争 网 络 中 。 
在 那里 ， 其 网 络 的 期 望 输 出 是 通过 莞 争 网 络 的 竞 征 而 得 到 的 。 
































5.1.2 外 星 学 习 规 则 


外 星 网 络 的 激活 函数 是 线 忻 昌 数 ， 它 被 用 来 学 习 回 忆 一 个 和 失 恕 ， 其 网 络 输入 忆 也 可 
以 是 吃 一 个 神经 匹 模型 的 输出 。 外 时 被 训练 来 在 一 层 * 个 线性 神经 元 的 和 输出 端 产 生 一 个 特 
列 的 矢量 4， 所 采用 的 方法 与 内 星 识别 矢量 时 的 方法 极其 相似 。 

对 于 一 个 外 是， 其 学 习 磺 则 为 : 

Ai =1T (2 一 Wi 局) (5.4) 

与 肉 星 不 同 ， 外 是 联接 强度 的 变化 Aw 是 与 输入 矢量 P 成 正比 的 。 这 意味 着 当 输 入 矢 
量 被 保持 高 值 ， 比 如 接近 1 时， 每 个 权 值 wr 将 趋 于 输出 双 值 ， 若 户 = 1， 则 外 星 使 权 值 


产生 输出 矢量 。 
当 输 入 秋 旺 户 为 08 时， 网 络 校 值得 不 到 任何 学 习 与 修正 。 
当 有 个 外 星相 并 联 ， 每 个 外 是 与 个 线性 神经 元 相连 组 成 一 层 外 星 时 ， 每 当 某 个 外 
星 的 输入 节点 被 置 为 1 时 ， 与 共 相 连 的 权 值 到 矢量 w 就 会 被 训练 成 对 应 的 线性 神经 元 的 
和 输出 矢量 4， 其 权 值 修正 方式 为 : 
4A 厂 =lrvf4- 册 ) 己 [5.5) 
其 中 ， 多 =3Xr 为 权 值 列 失 昌 :; 工 为 学 习 速率 ; 4 = SX7 为 外 星 输 出 。 
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内 星 与 外 星之 间 的 对 称 性 是 非常 有 用 的 。 对 一 组 输入 和 目标 来 训练 一 个 内 星 层 与 将 其 
输入 与 目标 相对 换 ， 来 训练 一 个 外 星 层 的 结果 是 相同 的 ， 即 它们 之 间 的 权 抑 阵 的 结果 是 相 
互 转 置 的 。 


5. 1.3 科 谷 伦 学 习 规则 





科 荷 伦 ( 慌 ohonen) 学 习 规则 是 由 内 星 规则 发 展 而 来 的 。 对 于 其 值 为 0 或 1 的 内 星 输 
出 ， 当 只 对 输出 为 1 的 内 星 权 和 矩阵 进行 修正 ， 即 学 习 规 则 只 应 用 于 输出 为 荆 的 内 星 上 ， 将 
内 星 学 习 规 则 中 的 所 权 值 1， 则 可 导出 科 荷 伦 规则 为 : 

Ai 一 开 P 一 Wi (3.6) 

科 荷 伦 学 习 规 则 实际 上 是 内 星 学 习 规 则 的 一 个 特例 ， 但 它 比 采用 内 星 规 则 进行 网 络 设 
计 要 节 和 演 更 密 的 学 习 ， 因 而 常常 用 来 瞪 代 内 星 学 习 规 则 。 

一 般 情况 上 ， 科 荷 伦 学 习 规 则 比 内 星 学 习 规 则 能 够 提高 训练 速度 1 到 2 个 数量 级 。 


5.2 自 组 织 竞争 网 络 


5. 2. 1 网 络 结 梅 


竞争 网 络 由 单 层 神 经 元 网 络 组 成 ， 其 输入 节点 与 输出 节点 之 闻 为 全 互联 结 。 因 为 网 络 
在 学 习 和 中 的 竞争 特性 也 表现 在 输出 屋 上 ， 所 以 在 竞争 网 络 中 把 输出 层 又 称 为 竞争 层 ， 而 与 
输入 节点 相连 的 权 值 及 其 输入 合 称 为 输入 层 。 实 际 上 ， 在 竞争 网络 中 ， 输 入 层 和 竞争 层 的 
加 权 输 入 和 共用 同一 个 激活 函数 ， 如 图 5.3 所 示 。 





网 5.3 亮 争 网 络 结构 图 
竞争 网 络 的 激活 函数 为 二 值 型 10.1] 困 数 。 
从 网 络 的 结构 图 中 可 以 看 出 ， 自 组 织 竞 争 网 络 的 权 值 有 两 类 ， 一 类 是 输入 节点 了 到 ; 
的 权 值 w Ci= 1 2,…5 = 1.2,.r)， 这 些 权 值 是 通过 训练 可 以 被 调整 的 ， 另 一 类 是 竞 
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争 层 中 互相 抑制 的 权 值 wx (K = 1 2 ,ss )。 这 类 权 值 是 固定 不 变 的 ， 且 它 满足 一 定 的 分 
布 关 系 , 如 距离 近 的 抑制 强 , 距离 远 的 抑制 弱 。 另 外 , 它们 是 一 和 神 对 称 权 值 , 即 有 wx， = wur 
同时 相同 神经 元 之 间 的 权 估 起 加 强 的 作用 ， 即 满足 wii=wz=,…= ww >0， 而 不 同 神经 元 之 
间 的 权 值 相互 抑制 ， 对 于 大 =i， 有 mwicO。 

下 面 来 具体 分 析 索 争 网 络 的 笨 出 情况 。 

设 网 络 的 输入 拓 量 为 : 已 =[ 疡 请 …… 记 下 

对 应 网 络 的 输出 失 基 为 : 4= [到 一 对 
由 于 竞争 网 络 中 含有 丙种 权 值 ， 所 以 其 激活 函数 的 加 权 和 输入 和 也 分 为 两 部 分 : 一 为 来 
自得 入 节点 的 加 权 输 入 和 关 ， 一 为 米 自觉 争 层 内 互相 抑制 的 加 权 输 入 和 G。 具 体 地 说 ， 对 
于 第 守 个 神经 元 ， 有 : 

全 米 自 输入 节点 的 加 权 和 输入 和 为 : 























有 
应 三 之 mT (5.7) 
关 1 


久米 自 范 人 委 层 内 互相 抑制 的 加权 输入 和 为 : 
呈 ii 二 于 W 汰 … 人 -8) 
KE 了 
这 里 ， 玉 表示 竞争 层 中 含有 神经 元 节点 的 某 个 区 域 ， 如 果 九 表示 的 是 整个 竞争 层 ， 竞 争 
后 只 能 有 一 个 神经 元 兴 译 而 获胜 ， 如 果 竞 争 层 被 分 成 若干 个 区 域 ， 则 竞争 后 每 个 区 域 可 产 
生 一 个 获胜 凋 。 

则 于 入 与 网 络 的 输出 值 有关， 而 梨 出 值 又 是 由 网 络 竞争 后 的 结果 所 决定 的 ， 所 以 多 
的 值 也 是 由 竞争 结果 确定 的 。 为 了 方便 起 抑 ， 下 面 以 六 这 整个 网 络 输出 节点 的 情况 来 分 
析 竟 争 层 内 互相 抑制 的 加 权 输 入 和 8 的 可 能 结果 。 

al 如 果 在 竟 争 后 ， 第 半 个 节点 “ 赢 ” 了 ， 则 有 : 


人 = |， 天 二 了 





























而 其 他 所 有 节点 的 输出 均 为 零 ， 即 : 
全 一人， 天 = | 2, 3 天天; 


此 时 
宇 
中 一 了 W 庆 二 (5.9) 
5 
b) 如 果 在 竞争 后 ， 第 工 个 节点 “ 输 ” 了 ， 而 “ 赢 ” 的 节点 为 上 则 有 : 
am =1, 大 =1 
GD， 天 一 1 2... ,3 大 拓 ] 
此 时 
可 
8 HT (5.10) 
kl 


所 以 对 整个 网 络 的 加 权 输 入 总 和 有 三 式 成 习 ; 
3 = 有 + ， 对 于 “” 的 节点 1 


5i = 贞 一 |wi|， 对 于 所 有 “和 输 ” 的 节点 ;= 1,2, ,95izL 。 
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由 此 可 以 看 出 ， 经 过 竞争 后 只 有 获胜 的 那个 节点 的 加 权 输 入 总 和 为 最 大 。 癌 他 网 络 的 
输出 为 : 


1 二 一 下 2 
辣 -| 5 二 Inaxf3i 3) (410 


0 其 他 


因为 在 权 值 的 修正 过 程 中 只 修正 输入 层 中 的 权 值 wj， 营 争 层 肉 的 权 值 央 是 固定 不 变 
的 ， 它 们 对 改善 竞争 的 结果 只 起 到 了 加 强 或 削弱 作用 ， 即 对 获胜 点 增加 一 个 正 值 ， 使 其 
更 易 获 胜 ， 而 对 输出 的 节点 增加 一 个 负 值 ， 使 其 更 不 易 获 胜 ， 而 对 改变 节点 竞争 结果 起 决 
定性 作用 的 还 是 输入 层 的 加 权 和 声 ， 所 雇 在 判断 竞争 网 络 节点 胜 负 的 结果 时 ， 可 直接 采用 
如 ， 凤 : 


| 
天 赢 = Iax( 羡 Wi 门 (5.12) 
拓 1 


取 偏 差 恕 为 零 是 判定 竞争 网 络 获胜 节点 时 的 典型 情况 ， 偶 尔 也 采用 下 式 进 行 竟 争 结 
果 的 判定 : 


矿 
六 一 ma( 之 后 十 站， -1<P<nO {S.13) 
上 一 


其 型 的 妃 值 取 -0.95。 加 上 :5 值 意味 着 取 户 = -ol 这 一 最 坏 的 情况 。 
通过 上 而 分 析 ， 可 以 将 竞争 网 络 的 工作 原理 总 结 如 下 ， 竞 争 网 络 的 激活 函数 使 加 权 答 
入 和 为 最 大 的 节点 赢得 输出 为 1， 而 其 他 神经 元 的 输出 芭 为 0。 


5. 2. 2 竞争 学 习 规 则 


觉 争 网 络 在 经 过 竞争 而 求 得 获胜 节点 后 ， 则 对 与 获胜 节点 相连 的 权 值 进行 调整 ， 调 整 
权 值 的 目的 在 为 了 使 权 值 与 其 输入 矢量 之 间 的 差别 越 有 来 越 小 ， 从 而 使 训练 后 的 竞争 网 络 的 
权 值 能 够 代表 对 应 输入 矢量 的 特征 ， 把 相似 的 输入 矢量 分 成 了 同一 类 ， 并 由 输出 来 指示 所 
代表 的 类 别 。 

范 争 网 络 修正 权 值 的 公式 为 ， 


Awy =IT(Pi 一) (5.14) 





式 中 ,为 学 习 速 率 , 且 0 < 工 < 1， 一 般 的 取 值 范围 为 0.01 ~- 0.3; 户 为 经 过 归 一 化 处 理 
后 的 输入 。 

不 论 采 用 哪 种 学 习 方法 ， 层 中 每 个 最 接近 输入 矢量 的 神经 元 ， 通 过 每 次 权 值 调整 而 使 
权 值 天 重 逐 渐 趋 于 这 些 输入 失重。 从 而 竞争 网络 通过 学 习 识 别 了 在 网 络 输入 端 所 出 现 的 矢 
量 ， 并 将 其 分 为 某 一 类 。 
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5.2.3 竞争 网 络 的 训练 过 程 


型 懂 网 络 的 训练 过 程 是 为 了 更 好 地 设计 出 网 络 。 

因为 只 有 与 效 胜 节点 相连 的 权 值 才能 得 到 修正 ， 通 过 其 学 习 法 则 使 修正 后 的 权 值 更 加 
接近 其 获胜 输入 矢量 。 络 果 是 ， 获 胜 的 节点 对 将 来 再 次 出 现 的 相似 矢量 (能 被 偏 养 记 所 包 
赛 ， 或 在 偏差 池 围 以 肉 的) 更 加 容易 赢得 该 节点 的 胜利 。 而 对 于 一 个 不 同 的 失 量 出 现时 ， 
就 更 加 不 易 取 胜 ， 但 可 能 使 其 他 某 个 节点 获胜 ， 归 为 另 一 类 秋 量 群 中 。 随 着 输入 矢量 的 重 
复出 现 而 不 断 地 调整 与 胜 者 相连 的 权 和 拓 量 ， 以 使 其 更 加 接近 于 某 一 类 输入 矢量 。 最 终 ， 如 
采 有 足够 的 神经 元 节点 ， 每 一 组 输入 矢量 都 能 使 某 一 节点 的 输出 为 1 而 谷 为 该 类 。 通 过 重 
复 训练 ， 自 组 织 竞争 网 络 将 所 有 和 输入 矢量 进行 了 分 类 。 

所 以 竞争 网 络 的 学 习 和 训练 过 程 ， 实 际 上 是 对 输入 舌 量 的 划分 训 关 过 程 ， 使 得 获胜 节 
点 与 输入 和 失 晶 之 间 的 权 矢 量 代表 获胜 输入 矢量 。 

这 样 ， 当 达到 最 大 循环 的 值 后， 网 络 已 重复 多 次 训练 了 已 中 的 所 有 矢 荆 ， 训 练 结 束 
后 ， 对 于 用 于 训练 的 和 模式 忆 ， 其 网 络 输出 矢量 中 ， 其 值 为 1 的 代表 一 种 类 型 ， 而 每 类 的 和 典 
型 模式 值 册 该 输出 节点 与 输入 节点 相连 的 权 舌 量 表示 。 

竞争 网 络 的 输入 层 节点 > 是 由 已 知 和 输入 矢量 决定 的 ， 但 竞争 层 的 神经 元 数 * 是 由 设计 
者 确定 的 ， 它 们 代表 输入 矢量 可 能 被 化 为 的 种 类 数 ， 其 值 若 被 选 得 过 少 ， 则 会 出 现 有 些 输 
入 矢量 无 法 被 分 类 的 不 恨 结果 ; 但 若 被 选 得 太 大 ， 竞 争 后 可 能 有 许多 节点 都 被 空间 ， 而 且 
在 网 络 竞争 过 程 中 还 占用 了 大 晶 的 设计 量 和 时 间 ， 在 一 定 程度 上 造成 了 一 定 的 痕 费 ， 所 以 
一 般 情况 下 ， 可 以 根据 输入 和 失 量 的 维 数 及 其 估计 ， 再 适当 地 增加 些 煞 目 来 确定 。 

另外 还 要 事先 确定 的 数 有 : 学习 速率 和 最 大 循环 煞 。 竞 争 网 络 的 训练 是 在 达到 最 大 律 
环 次 数 后 个 止 ， 这 个 数 一 般 可 皮 输 入 矢量 数组 的 40~50 倍 ， 即 使 每 组 输入 矢量 能 够 在 网 
络 重复 出 项 40-50 次 。 

然后 网 络 则 可 以 进入 总和 争 以 及 权 伸 的 调整 阶段 。 

竞争 网 络 比 较 适 合用 于 具有 大 批 相 似 数 组 的 分 类 问题 。 下 面 给 出 例题 米 说 明 竞 争 网 络 
的 功效 。 

例 51 对 下 列 模式 P 进 行 分 类 辨识 。 

P = [0.7071 0.6402 0.000 -0.1961 0.1961 -0.9285 -0.8762 -0.8192 ; 

[0.7071 0.7682 -1.000 -0.9806 -0.9806 0.3714 0.4819 0.5735 ] ; 

解 : 输入 模式 已经 为 归 一 化 处 理 后 的 数据 。 对 于 网 络 结构 ， 我 们 取 3 = 4; 并 随机 
到 一 组 初始 矩阵 为 ， 

WHOD= [-0.3347 -0. 电 13， 

-0.S466 -0.8374; 

-0.8690 -0.4948: 
0.4611 -0.8874]; 




















胃 取 : 
= 0.05;: 
max_epoch = 320; 
隐 


这 里 取 了 输入 数据 的 20 倍 。 最 大 循环 数 一 般 庶 根据 输入 数据 的 多 少 来 决定 ， 
1) 训练 竞争 
为 了 能 够 更 清楚 地 理解 训练 竞争 过 程 ， 我 们 仍 可 以 道 过 周 解法 求解 释 。 和 感知 器 的 分 
美方 式 类 似 ， 二 值 型 分 类 的 实质 是 通过 将 笨 入 矢量 空间 进行 分 割 而 达到 分 类 目的 。 在 此 ， 
我 们 用 横 、 纵 坐标 分 别 表 示 让 和 记 矢 量 。 与 感知 串 的 不 同 的 是 ， 竞 争 网 络 所 用 的 失 昌 是 
模 为 1， 所 以 矢量 的 变化 ， 在 举 标 上 形成 的 轨迹 为 以 原点 为 中 心 的 单位 圆 。 网 络 党 争 的 目 
的 ， 是 使 权 值 多 经 过 竞争 后 和 狗 渐 移动 到 能 够 代表 输入 舌 量 类 别 的 点 上 ( 也 处 于 单位 圆 上 )。 
在 训练 过 程 中 ， 当 第 一 次 出 现 输入 矢量 比如 已 时 ， 有 W =plisgs7= 12 r。 但 当 
P2 出 现时 ， 若 也 具有 与 邢 ; 相似 的 特性 。 则 通过 对 岗 的 修正 ， 使 赔 惨 向 产 ， 治 下 一 次 产 
再 次 输入 时 ，VWw 又 被 修正 得 移 向 P。 这 样 ， 经 过 多 次 训练 后 ， 同 所 得 的 结果 为 几 个 相同 
类 型 输入 模式 的 绊 均 值 ， 而 当 一 个 不 同类 型 的 横 式 输入 ， 将 使 竞争 网 络 中 的 共 他 节点 获胜 
而 得 到 -个 新 的 权 抵 阵 。 如 此 重复 ， 可 以 将 所 有 的 不 同类 型 的 模式 都 娶 集 到 相同 的 权 拢 阵 
下 ， 每 个 权 抄 隆 代 表 一 种 美 型 ， 而 输出 失 量 中 的 1 的 列 位 置 则 指出 与 此 节点 相连 的 权 失 晶 
所 代表 的 输入 僚 量 组 的 位 置 。 图 5.4 为 网 络 竞争 前 的 权 矢 量 位 置 图 ， 图 4.5 给 出 最 后 的 训 
练 结果 ， 图 中 权 矢 量 位置 是 用 “o” 来 表示 的 。 
本 例题 经 过 320 次 循环 后 得 到 最 后 结果 为 : 
W= [-0.0460 -0.9863; 
-0.5466 -0.8374; 
了 必 .8748 0.4747， 
0.6684 “0.7180]; 








PCD.g 有 
PC2.9) 有 








0 -1 0 1 
PNO 肌 在 人 大 让 力 
图 5.4 竞争 前 的 权 矢 量 位 置 图 图 5.5 竞争 结束 后 的 权 尔 量 位 置 图 
在 输入 模式 瑟 作 用 下 的 网 络 输出 为 : 
A=f00111000; 一 1 类 《第 3，4，5 列 输入 矢量 组 属于 同一 类 ) 
00000000; 一 空缺 


00000111 -3 类 (第 6，7，8 列 输入 拓 量 组 属于 同一 美 ) 
1100000 和 0 一 4 类 (第 1，2 列 输入 和 失 量 组 属于 同一 类 ) 
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独家 值 与 前 而 Wo 相 比 较 可 以 看 出 ， 第 一 行 的 值 与 初始 WO 值 完全 相同 ， 即 在 整个 竞 
争 训练 中 ，Wx 从 未 获得 过 胜利 ， 所 以 其 权 和 抢 阵 ~-- 次 也 没有 得 到 过 修正 ， 这 从 4 的 得 出 值 
上 看 得 很 清楚 : 当 已、 产 输入 时 ， 输 出 节点 4 获胜 ， 即 它们 属于 Ws 类 :， W4 可 代表 它们 
的 值 ， 严 、 严 和 严 属 第 1 类 ，Wi 是 他 们 三 个 的 代表 ，、 媚 和 严 同属 第 3 鞠 ，Ws 反映 
了 它们 的 特点 。 

2 ) 竞争 学 习 网 络 的 局 限 性 

党 争 网 络 适 用 于 具有 旧型 聚 类 特性 的 大 量 数据 的 辨识 ， 但 当 遇 到 大 量 的 具有 概率 分 布 
的 输入 和 失 盟 时， 竞争 网 络 就 无 能 为 力 了 ， 这 时 可 以 采用 科 和 荷 伦 网 络 来 解 诀 。 


5.3 科 荷 伦 自 组织 映 射 网 络 


神经 细胞 模型 中 还 存在 着 一 种 细胞 聚 类 的 功能 柱 。 它 是 由 多 个 细胞 聚合 而 成 的 ， 在 接 
受 外 界 刺激 后 ， 它 们 会 自动 形成 。 一 个 功能 柱 中 的 细胞 完成 同一 种 功能 。 

生物 细胞 中 的 这 些 现 象 在 科 笛 伦 网 络 模型 中 有 所 反映 。 当 外 界 输 入 不 同 的 样本 到 科 葡 
伦 自 组 织 映 射 网 络 中 ， 一 开始 时 箱 入 样本 引起 和 输出 兴 在 的 位 置 各 不 相同 ， 但 通过 网 络 自 组 
织 后 会 形成 一 些 输 出 群 ， 它 们 分 别 代 表 了 输入 样本 的 分 布 ， 反 映 了 输入 样本 的 图 形 分 布 特 
征 ， 所 以 科 荷 伦 网 络 常常 被 称 为 特性 图 。 

科 和 荷 伦 网 络 使 输入 样本 通过 竞争 学 习 后 ， 功 能 相同 的 输入 靠 得 比 较 近 ， 不 同 的 分 得 比 
较 开 ， 以 此 将 一 些 无 规则 的 输入 自动 排 开 ， 在 联结 权 的 调整 过 程 中 ， 使 权 的 分 布 与 输入 样 
本 的 概率 密度 分 布 相 似 。 所 以 科 荷 伦 网 络 可 以 作为 一 种 社 本 特征 答 测 器 ， 在 样本 排序 、 笠 
本 分 类 以 及 样本 检测 方面 有 广泛 的 应 用 。 

一 般 可 以 这 样 说 ， 科 荷 伦 网 络 的 权 矢 量 收 化 到 所 代表 的 输入 矢量 的 平均 值 ， 它 反映 了 
输入 数据 的 统计 特性 。 再 扩大 一 点 ， 如 果 说 一 般 的 竞争 学 习 网 络 能 够 训练 识别 出 输入 矢量 
的 点 特征 ， 那 么 科 荷 伦 网 络 能 够 表现 出 笨 入 矢量 在 线 上 或 平面 上 的 分 布 特征 。 

当 随 机 样本 输入 到 科 菏 伦 网 络 时 ， 如 果 样 本 足够 多 ， 那 么 在 权 值 分 布 上 可 以 近似 于 输 
入 随机 样本 的 概率 密度 分 布 ， 在 输出 神经 元 上 也 反映 了 这 种 分 布 ， 即 概率 大 的 样本 集中 在 
输出 空间 的 某 一 个 区 域 ， 如 果 输 入 的 样本 有 几 种 分 布 类 型 ， 则 它们 各 自 会 根据 其 概率 分 布 
集中 到 输出 空间 的 各 个 不 同 的 区 域 。 每 一 个 区 域 代表 同一 类 的 样本 ， 这 个 区 域 可 以 逐步 缩 
少 ， 使 区 域 的 划分 越 米 越 明 号 。 在 这 种 情况 下 ， 不 论 输入 样本 是 多 少 维 的 ， 都 可 以 投影 到 
低 维 的 数据 空间 的 某 个 区 域 上 。 这 种 形式 也 称 为 数据 压缩 。 同 时 ， 如 果 高 维 空间 中 比较 相 
近 的 样本 ， 则 在 低 维 空间 中 的 投影 也 比较 相近 ， 这 样 就 可 以 从 中 取出 笠 本 空间 中 较 多 的 信 
息 。 遗 尽 的 是 ， 网 络 在 高 维 责 射 到 低 维 时 会 出 现 畏 变 ， 且 压缩 比 越 大 ， 上 畸变 越 太 ， 另 外 ， 
网 络 要 求 的 输入 节点 数 很 大 ， 因 而 科 荷 伦 网 络 比 其 他 人 工 神 经 网 络 (如 BP 网 络 》 的 规模 
要 大 。 
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5. 3. 1 科 谷 伦 网 络 的 拓扑 结构 


科 荷 伦 网 络 结 梅 也 是 商 层 : 输入 层 和 竞争 层 。 与 基本 党 争 网 络 不 同 之 处 赴 其 竞争 屋 林 
以 由 一 维 或 二 维 网 络 矩 阵 方 式 组 成 ， 且 权 值 修正 的 策略 也 不 同 。 

多 一 维 网 络 结构 与 基本 竞争 学 习 网 络 析 同 ; 

名 二 维 网 络 结构 ， 如 图 56 所 示 ， 网 络 上 层 有 输出 节点 s 个 ， 按 一 维 形 式 排 成 一 个 结 
点 第 阵 ， 和 输入 节点 处 于 下 方 ， 有 了 个 矢量 ， 即 ”个 节点 ， 所 有 和 输入 节点 到 所 有 输出 节点 之 
间 部 有 权 值 连接 ， 而 且 在 二 维 平井 上 的 输出 结 点 相互 间 也 可 能 是 局 部 连接 的 。 

科 荷 伦 网 络 的 激活 函数 为 一 们 型 函数 。 一 般 情 况 下 所 值 国定 ， 其 学 习 方 法 与 普通 的 癌 
争 学 习 算 法 相同 。 在 竞争 层 中 ， 每 个 神经 泡 部 有 自己 的 邻 域 ， 图 5.7 为 一 个 在 二 维 层 中 的 
主神 经 元 。 主 神经 元 具有 在 其 周围 增加 直径 的 邻 域 。 一 个 直径 为 1 的 邻 域 包括 主神 经 及 它 
的 直接 周围 神经 元 所 组 成 的 区 域 ， 直 径 为 2 的 邻 域 包括 直径 1 的 神经 元 以 及 它们 的 邻 威 。 
图 中 主神 经 元 的 位 置 是 通过 从 左上 端 第 一 列 开始 顺序 从 左 到 右 、 从 上 到 下 找到 的 。 如 图 中 
的 10x 10 神经 元 层 ， 其 主神 经 元 位 于 65。 
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图 5.6 一 维 科 荷 伦 网 络 结构 图 
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网 5.7 二 维 神经 元 层 示意 图 
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特性 图 的 激活 函数 也 古 . . 值 型 函数 ， 同 苑 争 网 络 ~… 样 可 以 取 偏 置 忆 为 零 或 固定 为 一 常 
数 。 鄞 争 层 的 竞争 结果 ， 不 仅 使 如 权 和 输入 和 为 蜡 大 值 者 获 耿 而 输出 为 1， 同 时 也 使 获胜 节 
点 周围 的 邻 域 也 同时 输出 为 1。 另 外 ， 在 权 伸 调整 的 方式 上 上 ， 特 性 多 网 络 不 仅 调整 与 获胜 
节点 相连 的 权 值 ， 和 而 且 对 获胜 节点 邻 域 节 点 的 权 值 也 进行 调整 ， 即使 其 周围 六 的 区 域内 
神经 元 在 不 同 程度 上 也 得 到 兴奋 ， 在 六 以 外 的 神经 元 部 被 抑制 ， 这 个 六 区 域 可 以 是 以 获 
胜 节 点 为 中 心 的 正方 形 ， 也 可 以 为 六 角形 ， 对 于 一 维 输出 ， 殊 则 为 以 无 为 中 心 的 下 上 仓 
点 。 


5. 3.2 网 络 的 训练 过 程 


科 荷 伦 网 络 在 训练 开始 时 和 尊 通 的 竞争 网 络 一 样 ， 其 输入 节点 竞争 的 胜利 者 代表 某 类 
模式 。 然 后 定义 获胜 节点 的 邻 域 节 点 ， 即 以 获胜 节点 为 中 心 的 某 一 半径 内 的 所 有 节点 ， 并 
对 与 其 相似 的 权 和 矩阵 进行 调整 。 随 着 训练 的 继续 进行 ， 获 胜 节 点 大 的 半 径 将 逐渐 变 小 ， 直 
到 最 万 只 包含 获胜 节点 天 本 车 。 也 哑 是 说 ， 在 训练 的 初始 阶段 ， 不 但 对 获胜 的 节点 作 权 值 
的 调整 ， 而 卫 对 其 周围 较 大 犯 围 内 的 几何 邻接 节点 也 作 相 应 的 调整 ， 人 前 随 着 训练 过 程 的 进 
行 ， 与 获胜 输出 节点 相思 的 权 和 矩阵 就 越 来 越 接 近 其 所 代表 的 模式 类 ， 此 时 ， 需 要 对 获胜 节 
点 进行 较 细 致 的 权 抢 阵 调 整 。 同 时 ， 只 对 其 几何 邻接 较 接 近 的 节点 进行 相应 的 调整 。 这 样 ， 
在 训练 结束 后 ， 几 何 上 相近 的 输出 节点 所 连接 的 权 矢 量 既 有 联系 ( 即 类 似 性 )， 又 相互 有 区 
别 ， 保 证 了 对 于 某 一 类 输入 模式 ， 获 姓 节点 能 作出 最 大 的 响应 ， 而 相 邻 节点 作出 较 少 响应 。 
几何 上 相 邻 的 节点 代表 特征 上 相似 的 模式 类 别 。 


5.3.3 科 谷 伦 网 络 的 应 用 


当 大 量具 有 典型 特性 的 模式 需要 进行 分 类 时 ， 除 了 可 以 用 感知 器 进行 分 类 外 ， 还 可 以 
采用 自 组织 党 争 网 络 ， 利 用 竞争 网 络 进行 模式 分 类 的 另 一 个 特点 是 ， 它 不 俱 可 以 将 每 个 横 
式 分 成 各 自 所 属于 的 类 型 ， 而 且 还 可 以 同时 获得 每 一 种 类 型 的 典型 模式 〔〈 一 般 为 该 类 型 模 
式 的 平均 值 )。 从 网 络 结构 上 讲 ， 竞 争 网 络 症 一 种 单 层 神经 网 络 ， 与 普 道 单 层 网 络 不 同 的 
是 ， 除 了 输入 节点 与 箱 出 节点 之 间 为 全 面 联 接 外 ， 竞 争 网 络 在 输出 层 每 个 输出 节点 之 间 还 
具有 相互 的 联接 ,并 且 网 络 在 学 习 中 的 竞争 特性 也 是 者 现 在 输出 层 上 , 所 以 在 竟 争 网 络 中 ， 
人 们 把 输出 层 又 称 为 这 争 层 ， 而 输入 节点 及 与 其 相连 的 权 值 合 称 为 输入 层 。 实 际 上 ， 在 竞 
争 层 中 ， 输 入 层 与 竞争 层 的 加 权 输 入 和 共用 同一 个 激活 函数 ， 其 激活 函数 的 类 型 为 阶 跃 型 
{9， 昌 函数。 网 络 的 每 次 输入 只 有 唯一 的 一 个 输出 节点 在 经 过 竞争 获胜 后 能 够 输出 为 1， 
而 所 有 其 他 输出 均 为 0。 

科 荷 伦 网 络 可 以 作为 -一 种 样本 特性 检测 器 ， 在 样本 排序 、 样 本 分 类 以 及 样本 检测 方面 
有 广泛 的 应 用 。 在 无 监督 式 学 习 规 则 下 ， 网 络 通过 重复 几 十 次 的 样本 输入 并 不 断 修正 网 络 
枢 值 ， 最 终 使 网 络 的 权 值 收 全 到 所 代表 的 输入 模式 的 平均 值 ， 它 反映 了 输入 数据 〈 模 式 ) 
的 统计 特性 以 及 统计 密度 的 大 小 。 
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图 5.8 为 落 在 单位 圆 四 分 之 一 周期 圆周 上 随机 的 100 个 点 在 经 过 20 个 神经 元 的 科 荷 
伦 网 络 将 其 表示 出 的 最 后 结果 。 图 中 各 种 神经 元 之 间 的 距离 长 怎 表示 其 密度 的 大 小 ， 距 离 





























越 短 ， 密 度 越 高 。 
图 S$.9 为 用 Sxs 的 输出 节点 面积 表示 2000 个 随机 输入 样 杰 的 网 络 训 练 后 的 特性 图 。 
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六 二 和 
人 a) 输入 模式 矢量 图 (b) 唐 练 400 次 后 的 梳 值 矢量 贸 


图 5.8 
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ta) 输入 模式 特性 图 (b) 诈 4 000 次 后 的 特性 图 
疯 5.9 


5.4 小 结 





山 以 上 两 个 例子 可 以 看 出 : 

也 科 和 荷 伦 自 组 织 上 映射 网 络 除 可 以 进行 分 类 外 ， 还 具有 数据 压缩 功能 ， 

包 包 括 竞 争 网 络 在 肉 ， 这 些 网 络 的 工作 输入 模式 都 必须 经 过 妇 一 化 处 理 ， 邵 将 输入 模 
式 转化 为 单位 矢量 来 处 理 ， 

已 这 些 网 络 的 各 自 特点 是 ; 兽 通 竞争 网 络 能 够 训练 识别 出 输入 模式 所 在 的 “点 ” 特征 ; 
科 荷 伦 网 络 能 够 表 项 输入 模式 在 “ 线 ” 上 或 “ 平 而 ”上 的 分 布 特性 。 
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第 6 章 径 向 基 函 数 网 络 


6.f 径 向 基 函 数 及 其 网 络 分 析 


径 向 基 函 数 (Radial Basis Function， 简 称 RBF) 网 络 是 在 借鉴 生物 局 部 调节 和 交 有 登 接 
受 区 域 知 识 的 基础 上 提出 的 一 种 采用 局 部 接受 域 来 执行 函数 映射 的 人 工 神经 网 络 。RBF 
网 络 结构 是 由 一 个 隐 售 层 〈 径 向 基层 ) 和 一 个 线性 输出 层 组 成 的 前 向 网 络 ， 径 向 基层 的 结 
构图 如 图 6.1 所 示 。 隐 含 层 采 用 径 向 基 函 数 作 为 网 络 的 激活 函数 ， 径 向 基 函 数 是 一 个 高 斯 
型 畏 数 ， 它 是 将 该 层 权 值 失 旺 W 与 输入 矢量 已 之 间 的 矢量 距离 与 偏差 总 相 乘 后 作为 网 络 
激活 函数 的 输入 。 





图 6. 1 具有 有 个 输入 节点 的 径 向 基 函 数 网 络 结构 图 
由 图 6.1 可 知 ， 径 向 基层 输入 的 数学 表达 式 为 m = 光 ECwi 一 ) * 已 ， 径 向 基层 输出 


的 数学 表达 式 为 
本 一 忆 )* 虽 2 


_ (1 师 - 圳 旺 


由 《6.1》 式 可 以 看 出 ， 随 着 W 和 尸 之 间距 离 的 减少 ， 径 向 基 天 数 输 出 值 增加 ， 且 在 
其 输入 为 0 时 ， 即 外 和 已 之 间 的 距离 为 0 时 ， 输 旨 为 最 大 值 1、 由 此 ， 可 以 将 一 个 径 向 
基 神 经 元 作为 一 个 当 其 输入 矢量 已 与 其 权 值 矢量 丈 相 同时 输出 为 1 的 探测 器 。 

径 向 基层 中 的 偏差 疡 可 以 用 来 调节 基 函 数 的 灵敏 度 ， 不 过 在 实际 应 用 中 ， 更 直接 使 用 
的 是 刀 一 个 称 之 为 伸展 常数 C 的 参数 。 用 它 米 确定 每 一 个 径 向 基层 神经 元 对 其 输入 泉 量 ， 
也 就 十 忆 与 多 之 间距 离 响应 的 面积 宽度 。C 值 (或 加 值 》 在 实际 应 用 中 有 多 种 确定 方式 。 

径 向 基层 的 工作 原理 采用 的 是 聚 类 功能 。 不 失 一 般 性 , 考虑 只 维 空间 的 g 个 数据 点 (j， 
基 ，…， 加)， 假 定数 据 已 归 一 化 到 一 个 超 立方 体 中 。 由 于 每 个 数据 点 都 是 聚 类 中 心 的 候 
选 者 ， 因 此 ， 数 据点 大 处 的 密度 指标 定义 为 ; 
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《6.17) 





-an 屿 ha se ， 汪 1 直人 i -LN 一 站 Tie ee Treoh ki 1 


。 .| 之 
于 中 
也; = 立 exp 1 《6.2) 
总 (472) 





这 里 ， 4 是 一 个 正 数 ， 显然 ， 如 果 一 个 数据 点 具有 多 个 临近 的 数据 点 ， 则 该 数据 点 具有 
高 密度 值 。 半 丢 4 定义 了 该 点 的 一 个 邻 域 : 半径 以 外 的 数据 点 对 该 点 的 密度 指标 页 献 盐 
微 。 

在 计算 每 个 数据 点 的 密度 指标 后， 选择 具有 最 锅 密 度 指 标的 数据 点 为 第 一 个 聚 类 中 
心 ， 令 对 为 选中 的 点 ， De 为 其 密度 指标 。 沸 么 每 个 数据 点 X 的 密度 指标 可 用 公式 ， 


， .| 实 
Di- 户 -D 尼 (63 
二 a 名 em 忆 刺 .1 
来 修正 。 其 中 C 是 一 个 正 数 。 显然 ， 靠 近 第 一 个 涌 类 中 心 Xe 的 数据 点 的 害 度 指标 将 显 
著 减 小 ， 这 样 使 得 这 些 点 不 太 可 能 成 为 下 一 个 育 类 中 心 。 常 数 C 定义 了 一 个 密度 指标 显 
著 减 小 的 邻 域 。 常数 C 通 常 大 于 4， 以 避免 出 现 相 距 很 近 的 聚 类 中 心 。 一 般 可 选 C= 1.54。 
比方 法 可 称 为 减法 聚 类 法 。 
径 向 基 函 数 网 络 中 的 径 向 基层 怀 是 利用 以 上 的 聚 类 方法 来 作为 径 向 基 函 数 的 中 心计 算 
函数 的 输出 的 。 在 大 们 常用 的 MATTLAB 神经 网 络 工具 箱 中 , 志和 C 之 间 的 关系 式 设置 为 
五 =0.8326/C ， 将 避 值 代入 《6.1) 式 ， 有 : 


- 剖 .08326 耻 - 吓 丫 
-人 下 ] ai 





人 一 已 《6.4) 

此 种 参数 选 法 使 得 当 上 -~ 败 =C 时 ， 有 az&=e0s2 = 0.5。 

由 引 可 见 ， 当 取 吾 =0.8326/C ， 对 任意 给 定 的 一 个 C 值 ， 可 使 激活 层 在 加 权 输 入 的 
+C 处 RBF 的 输出 为 0.5， 而 通过 调整 C 值 ， 可 使 当 刷 - 刚 <sC 时 ，RBF 的 输出 大 于 吉 等 
于 0S5， 从 而 直观 地 达到 了 调整 RBF 昌 线 宽 度 的 日 的 。 

C 与 要 - 吕 以 及 RBF 输出 之 间 的 关系 如 图 62 所 示 ， 其 中 图 6.2 (b) 表示 中 心 为 本 ， 
宽度 为 C 的 RBF 曲线 图 。RBF 网 络 结构 图 如 图 6.3 所 示 ， 它 是 出 一 个 径 向 基层 和 一 个 线 
性 输出 层 组 成 的 。 








图 6. 2 径 向 基 陆 数 输 入 /输出 7 面积 宽度 关系 图 
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几 6.3 径 向 基 网 络 结构 图 


6.2 网 络 的 训练 与 设计 


RBF 网 络 的 训练 与 设计 分 为 两 步 ， 第 一 步 是 采用 非 监督 式 的 学 习 训练 RBF 层 的 权 值 ， 
第 二 步 是 采用 监督 式 学 习 训练 线性 输出 层 的 权 值 ， 网 络 设计 仍 需要 用 于 训练 的 输入 矢量 抵 
阵 户 以 及 目标 矢量 矩阵 了 ， 另 外 还 需要 给 出 RBF 层 的 伸展 常数 C 。 训 练 的 目的 是 为 了 求 
得 两 层 网 络 的 权 值 环 1 和 风 2 太 偏 莽 下 和 52 。 


RBF 层 的 权 值 训练 是 通过 不 断 地 使 lp 一 李 的 训练 方式 ， 使 该 层 在 每 个 mr 2 


处 使 RBF 的 输出 为 1， 从 而 当 网 络 工作 时 ， 将 任 一 输入 送 到 这 样 一 个 网 络 时 , RBF 层 中 的 
每 个 神经 元 都 将 按照 输入 和 失 量 接近 每 个 神经 元 的 权 值 和 失 量 的 程度 来 输出 其 值 。 结 果 是 ， 与 
权 值 相 离 很 远 的 输入 矢量 ， 使 RBF 层 的 输出 接近 0， 这 些 很 小 的 输出 对 后 而 的 线性 层 的 
影响 可 以 和 忽略。 另外， 任意 非常 接近 输入 矢量 的 权 值 ，RBEF 层 将 输出 接近 1 的 值 。 此 值 
将 与 第 二 层 的 权 值 加 权 求 和 后 作为 网 络 的 输出 ， 而 整个 输出 层 是 RBF 层 输出 的 加 权 求 和 。 
理论 证 明 ， 只 要 RBF 层 有 是 鳞 的 神经 元 ， 一 个 RBF 网 络 可 以 任意 期 望 的 精度 逼近 任何 函 
数 。 

通常 RBF 网 络 的 隐 含 层 的 节点 数 的 确定 是 设 定 为 与 输入 疡 中 的 样本 组 数 了 相同 的 数 
目 ， 阳 每 个 RBF 层 中 的 权 值 W1 被 赋予 一 个 不 同 输入 矢 景 的 转 置 ， 以 使 得 每 个 RBF 神经 


元 都 作为 不 同 P8 的 探测 器 。 对 于 有 9 组 输入 矢量 ， 则 RBP 层 中 的 神经 元 数 为 9 。 刀 中 的 


每 个 仿 差 都 被 置 为 0.8326/C ， 由 此 来 确定 输入 空间 中 每 个 RBF 响应 的 面积 宽度 。 例 如 ， 

己 取 4， 那 么 每 个 RBF 神经 元 对 任何 输入 矢量 与 其 对 应 的 权 值 矢量 之 间 的 距离 小 于 4 的 
响应 为 05 以 上 。 一 般 而 言 ， 在 RBF 网 络 设计 中 ， 随 着 C 取 值 的 增 大 ，RBEF 的 响应 范围 
下 以 扩大 ， 且 各 神经 元 函数 之 间 的 平 渭 度 也 较 好 : C 取 值 的 减 小 ， 则 使 得 函数 形状 较 窑 ， 
使 得 与 权 值 矢量 距离 较 近 的 输入 才 有 可 能 接近 1 的 输出 ， 而 对 其 他 输入 的 响应 不 敏感 。 所 
以 ， 当 采用 与 输入 数组 相同 数目 的 RBF 层 神经 元 时 ，C 值 可 以 取 的 较 小 《比如 C<l)。 

但 当 希 望 用 较 少 的 神经 元 数 示 和 逼 近 较 多 输入 数组 〈 即 较 大 输入 范围 时， 应当 取 较 大 的 
C 值 (比如 C=1-4)， 以 保证 能 使 每 个 神经 元 可 同时 对 几 个 输入 组 都 有 较 好 的 响应 。 
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在 确定 了 W1 和 电 后 ，RBF 层 的 输出 直 则 可 求 出 。 此 时 ， 可 以 根据 第 二 层 的 输入 @ 以 
及 网 络 输出 的 目 术 了， 通过 使 网 络 输出 与 目标 输出 了 的 误 盖 平方 和 最 小 来 求 线性 输出 层 
的 校 值 丈 2 及 其 偏差 22 ， 不 过 妃 =0。 这 是 因为 ， 我 们 所 求解 的 切 一 个 具有 台 个 限制 “ 输 
入 /输出 目标 对 ) 的 解 ， 而 每 个 神经 元 有 &+1 个 变量 来自 刀 个 神经 元 的 权 值 以 及 一 个 偏 
差 刀 )， 一 个 具有 台 个 限制 和 多 于 @ 个 变 基 的 线性 方程 组 将 有 无 穷 多 个 非 零 解 。 

上 述 设计 过 程 的 缺点 是 : 所 设计 出 的 RBF 网 络 产生 的 隐 舍 层次 络 所 具有 的 神经 元 数 日 
与 输入 矢量 组 数 相 同 。 当 需 材 许 铬 组 失重 来 定义 一 个 网 络 时 ， 用 毕 方 法 设计 的 网 络 可 能 十 
不 可 接受 的 。 对 此 采用 的 改进 思想 则 基 : 在 满足 目标 误差 的 前 提 下 尽 最 减少 RBF 层 中 的 视 
经 元 数 。 其 做 法 则 是 : 从 一 个 节点 开始 训练 ， 通 过 检查 误差 目标 使 网 络 自动 增加 节点 。 每 
次 循环 用 使 网 络 产生 最 大 误差 所 对 应 的 输入 矢量 产生 一 个 新 的 RBF 层 节 扣 ， 然 乒 检 查 新 网 
络 的 误差 ， 重 复 此 过 程 ， 直 到 达到 目标 误差 或 达到 最 大 神经 元 数 为 止 。 

从 结构 上 看 ，RBF 网 络 似乎 就 是 一 个 共有 径 和 内 基 函 数 的 即 网 络 ， 它 们 有 着 同样 的 两 
层 网 络 一 一 隐 售 层 具 有 径 向 基本 数 : 一 种 高 斯 型 指数 冰 数 ， 输 出 层 具有 线性 激活 函数 。 但 
是 ，RBF 网 络 不 是 了 网 络 ， 其 原因 是 : 全 它 不 是 采用 BP 算法 米 训 练 网 络 权 值 的 ， 名 其 训 
练 的 算法 不 是 梯度 下 降 法 。 昌 然 是 两 层 网 络 ， 径 向 基 网 络 的 权利 训练 是 一 度 一 层 进 行 的 。 


在 对 隐 含 层 中 径 向 基 函 数 权 值 进行 训练 时 ， 网 络 训练 的 目的 是 使 wler = 站 。 田 于 径 向 基 
组 数 在 将 其 输入 放置 在 原点 时 输出 为 1， 而 对 其 他 不 同 的 输入 值 的 响应 均 小 于 1， 所 以 设 
计 将 每 一 组 输入 值 P? 作为 一 个 笃 向 基 冰 数 的 原点 ， 而 权 值 w 六 代表 中 心 的 位 置 。 则 通过 











令 wgj = p9 使 每 一 个 径 向 基 函 数 只 对 一 组 p9 响应 ， 从 而 迅速 辨识 出 p9 的 大 小 。 然 后 进 


行 输出 层 的 权 什 设计。 由 于 答 出 层 是 线性 函数 ， 网 络 输出 是 径 向 基 网 络 输出 的 线性 组 合 ， 
从 而 很 容易 地 达到 了 从 非 线 性 输入 空间 向 输出 空间 遇 射 的 目的 。 

从 功能 上 看 ， 和 BP 网 络 一 样 ，RBF 网 络 可 以 用 来 进行 函数 和 逼近。 并且 训练 RBF 网 络 
要 比 训练 卫 网 络 所 花费 的 时 间 要 少 得 多 , 这 是 该 网 络 最 突出 的 优点 。 不 过 , 如 前 所 述 ，RBF 
网 络 也 有 自身 的 缺点 。 一 般 而 言 ， 即 使 采用 改进 的 方法 来 设计 ，RBF 网 络 中 陷 含 层 节 点 数 
比 采 用 S 型 转移 函数 的 前 向 网 络 所 用 的 数目 要 多 许多 。 这 是 因为 $ 型 神经 元 有 一 个 较 大 范 
围 的 输入 空间 ， 而 RBF 网 络 只 对 输入 空间 中 的 一 个 较 小 的 范围 产生 响应 ， 结 果 是 ， 输 入 空 
间 越 大 《“ 即 输入 的 数组 以 及 和 输入 的 变化 范围 越 大 )， 所 需要 的 RBF 神经 元 数 越 多 。 





6.3 广义 径 向 基 网 络 


广 闪 径 向 基 盘 数 〈General Radial Basis Function， 简 称 6RBF) 网 络 具 有 一 个 径 向 
基层 和 一 个 特殊 的 线性 层 ， 如 图 6. 4 所 示 。 

和 普通 RBF 网 络 一 样 ， 在 径 向 基层 ， 神 经 元 的 每 个 激活 函数 加 权 和 输入 是 输入 泉 量 和 各 
自 权 和 值 的 距离 ， 即 司 1 一 如 ， 每 个 神经 元 的 输入 是 加 权 输 入 与 其 储 差 的 点 积 。 

与 普通 RBF 网 络 不 同 的 是 ，GRBF 网 络 的 RBF 层 答 出 后 ， 不 是 立刻 进行 线性 网 络 的 计 
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算 ， 而 是 将 RBF 层 的 输出 i 加权 及 平 均值 后 作为 线性 函数 的 输入 。RBF 层 的 输出 e; 为 通 
过 高 斯 型 径 向 基 函 数 的 输出 : 











的 2 
且 二 一 唱 0.8326 
ai 一 Exp -了 5 下 08326 (6.5) 
Ci 
图 6.4 广义 径 向 节 网 络 姑 构图 
整个 网 络 的 输出 为 : 
-之 4 多 和 (6.6) 
之 寻 


6.4 数字 应 用 对 比 及 性 能 分 析 


前 向 网 络 中 ， 不 论 是 BP 网 络 ， 还 是 RBF 网 络 ， 不 论 它们 是 用 于 建 模 ， 还 是 控制 ， 
或 是 其 它 领域 ， 所 利用 网 络 的 最 基本 的 功能 始终 只 有 一 条 ， 那 就 是 函数 有 逼近。 本 节 中 给 出 
对 函数 通 近 的 应 用 例子 ， 对 两 者 的 性 能 进行 对 比分 析 。 

用 于 曲线 逼近 的 输入 /输出 数组 为 : 


卫 =-1:0.1: 1; 

TI = [-.9602 -.5770 -.-0729 .3771 .6405 .6600 .4609 .,， 
.1336 -.2013 -.4344 -.5000 -.3930 -.1647 “0988 .. 
.3072 .3960 .3449 .1816 -.0312 -.2189 -.3201]， 


输入 和 输出 函数 之 间 的 关系 图 如 图 6. 5 所 示 。 作 为 对 比 ， 首 先 对 于 这 21 组 输入 /输出 
对 ， 构 造 一 个 隐 含 层 含有 10 个 神经 元 ， 并 采用 对 数 $ 型 激活 阔 数 ， 输 出 层 采 用 线 任 函数 
的 前 向 网 络 ， 然 后 分 别 采 用 标准 的 误 羡 反 向 传播 法 、 改 进 的 带 有 附加 动量 法 和 自 适 应 学 习 
速率 相 结合 的 快速 算法 、Levenberg-Marquardt 算法 。 而 RBF 网 络 的 训练 采用 的 是 自动 确 
定 所 需要 的 隐 含 层 节 点 数 的 方法 。 束 个 设计 与 训练 是 在 MATLABE 环境 下 ， 用 PIT400 计算 机 
进行 的 ， 期 望 误 善 取 0.01。 表 6.1 给 出 了 在 不 同 网 络 结构 以 及 不 同 算法 下 ， 解 决 同一 问 
题 押 花费 的 时 间 、 循 环 次 数 以 及 浮 点 操作 次 数 ， 从 中 可 以 看 出 不 论 从 哪个 指标 上 看 ， 标 准 
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BP 算法 与 最 好 的 性 能 指标 要 差 1~2 个 数量 级 。BP 网 络 中 L-M 算法 最 快 ， 它 几乎 可 以 和 
RBF 网 络 的 指标 相当 。 从 整体 情况 看 ，RBF 网 络 显示 出 快速 省 时 的 优点 ,将 RBF 和 GRBF 
网 络 相 比 ，GRBEF 所 花费 的 浮 点 计算 数 杰 明显 少 于 RBF 网 络 ， 这 是 因为 GRBEF 的 隐 含 层 
神经 元 数 是 与 训练 用 的 输入 组 数 相等 的 缘故 。 不 过 RBF 网 络 通过 自动 寻 优 ， 最 终 隐 含 层 
的 神经 元 数 只 有 6 个 ， 比 BP 网 络 的 10 个 还 要 少 。 实 验 表 明 ,对 于 周期 变化 次 数 不 太 多 的 
函数 逼近 问题 ，RBF 网 络 也 可 以 用 较 少 的 节点 达到 较 高 的 通 近 精度 ， 
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医 6.5 输入 和 输出 函数 的 关系 图 


表 6.1 实验 对 比 结果 
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6.5 小 结 





采用 RBF 网 络 进行 函数 逼近 ， 与 采用 BP 网 络 相 比 ， 前 者 更 容易 逼近 函数 的 局 部 特 
性 ， 而 后 者 由 于 是 用 一 个 全 周 函 数 来 逼近 函数 ， 因 此 ， 对 于 某 些 具体 问题 的 政 敏 速度 会 慢 
一 些 。 从 实用 角度 上 看 ， 对 于 函数 逼近 问题 ， 用 RBF 网 络 来 解决 可 能 更 为 合适 。 另 外 ， 
RBF 网 络 在 功能 上 与 模糊 系统 有 一 定 的 联系 ， 这 为 我 们 更 好 地 设计 出 模糊 系统 提供 了 --- 
个 新 的 思路 。 这 一 方面 的 内 容 将 在 第 12 章 中 做 进 -- 步 的 前述 。 
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第 7 章 模糊 理论 基础 


7.1 引 言 





模糊 理论 是 在 美国 加 州 大 学 但 德 〈L.A. zadeh) 教授 于 1965 年 创立 的 模糊 集合 理论 的 
基础 上 发 展 起 来 的 ， 主 要 包括 模糊 集合 理论 、 模 糊 逐 辑 、 模 糊 推理 和 模糊 控制 等 方面 的 内 
容 。 

在 经 典 二 值 逐 畦 中 ， 假 定 所 有 的 分 类 都 是 有 明确 边界 的 ， 任 一 被 讨论 的 对 象 要 剑 属 于 
这 一 类 ， 要 人 么 就 不 属于 这 一 类 ， 一 个 命 古 不 是 真 就 是 仿 ， 不 存在 亦 真 亦 盆 或 者 非 真 非 仿 的 
情况 。 模 糊 远 辑 是 对 二 值 还 辑 的 扩充 ， 它 是 为 解决 班 实 世 界 中 存在 的 模糊 现象 而 发 展 起 米 
的 ， 它 要 考虑 被 讨论 对 象 属于 其 一 类 的 程度 ， 一 个 命 感 可 能 亦 此 亦 彼 ， 存 在 着 部 分 真 和 部 
分 伪 。 例 如 ， 某 -品牌 汽车 ， 其 中 有 … 部 分 稚 件 是 进口 的 ， 其 他 零件 是 国产 的 ， 要 问 这 种 
汽车 是 否 是 国产 的 ， 那 该 怎么 回答 呢 ? 在 经 典 逻 辑 中 ， 要 么 回答 “是 ” 要 人 么 回答 “不 是 ” 
事实 上 ， 我 们 经 萤 会 这 样 说 :“ 这 种 车 的 零件 大 部 分 达到 了 国产 化 ”， 在 二 值 逻 辑 中 就 无 法 
表达 像 “大 部 分 ”这 样 不 精确 的 含糊 信息 : 实际 上 ,“ 大 部 分 ”还 有 一 个 “程度 ”的 问题 。 
在 模糊 到 和 轿 中 则 可 利用 隶属 度 来 撒 述 “程度 "， 那 么 就 可 说 这 种 车 国产 化 程度 基 86 中， 尚 
有 14%% 靠 进口 。 

在 处 理 现实 世界 的 问题 方面 ， 越 来 越 多 的 事实 说 明 模 糊 逻 辑 远 比 二 值 还 辑 更 为 有 效 。 
对 那些 无 法 建 模 的 复杂 问题 ， 有 不 少 用 模糊 逻辑 能 比较 好 地 解决 。 模 糊 逻 辑 之 所 以 十 分 有 
用 ， 就 在 于 它 能 够 在 经 引 的 二 仁 逐 辑 不 能 对 变 盟 进行 定义 的 情况 下 实现 有 意义 而 合理 的 操 
作 。 实 际 上 ， 在 我 们 昌 常 生活 中 经 常 不 断 地 会 用 到 模糊 逻辑 的 描述 方法 ， 故 模糊 逐 辑 是 通 
过 模仿 人 的 思维 方式 来 表示 和 分 析 不 确定 、 不 精确 信息 的 方法 和 工 上 只。 尽管 “模糊 ”这 个 
词 在 这 里 容易 使 人 产生 误解 ， 实 际 上 在 模糊 逻辑 控制 中 的 每 一 个 特定 的 输入 部 对 应 着 一 个 
实际 的 输出 ， 并 且 这 个 输出 值 是 完全 可 以 预测 的 。 所 以 模糊 逻辑 本 身 并 不 模糊 ， 模 糊 逐 辑 
并 不 是 “模糊 的 ” 逐 辑 ， 而 丰 用 来 对 “模糊 ”进行 处 理 以 达到 消除 模糊 的 逻辑 ， 它 是 一 种 
精确 解决 不 精确 、 不 完全 信 筷 的 方法 , 其 最 大 特点 就 是 用 它 可 以 比较 自然 地 处 理 人 的 概念 ， 
是 一 种 更 人 性 化 的 方法 。 许 多 事实 证 明 ， 用 逻辑 处 理 和 分 析 现 实 世 界 的 问题 ， 其 结果 往往 
更 符合 人 的 要 来， 如 上 用 模糊 肥 香 实现 控制 更 能 容忍 蛇 音 和 于 扰 和 元 器 件 的 变化 ， 使 系统 适 
应 性 更 好 ;， 横 类 逻辑 还 可 使 六 品 开发 周期 缩短 而 编程 更 容易 ， 所 以 模糊 逻辑 越 米 越 为 更 多 
的 科技 工作 者 接受 。 

模糊 逐 辑 是 通过 使 用 模糊 集合 米 工 作 的 。 模 糊 集 合 与 经 内 集合 是 不 同 的 。 经 典 集合 是 
有 具 有 精确 边界 的 集合 。 经 典 集合 对 集合 中 的 对 象 关系 进行 严格 划分 ， 一 个 对 银 要 么 十 完 全 
属于 这 个 集合 ， 要 么 就 完全 不 属于 这 个 集合 ， 不 存在 介 于 山 关 之 辣 的 情况 。 例 如 “包含 大 
于 5 的 实数 ”的 经 奥 集 合 4 可 以 表示 为 : 

4={xlxz>35} 《7.1) 
它 拥有 一 个 清晰 明 玫 的 边界 5。 如 果 x 大 于 这 个 数 就 属于 集合 4， 否 则 * 就 不 属于 集合 
模 类 集合 是 没有 精确 边界 的 集合 。 这 意味 者 ， 从 “属于 一 个 集 咎 。 到 “不 属 一 个 信人 
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之 间 的 转变 是 逐 新 的 ， 这 个 平滑 的 转变 足 山 来 属 函 煞 来 表征 的 ， 例 嫂 ， 如 果 X 是 论 域 ， 
且 其 攻 素 用 xx 来 定义 ， 蕊 中 的 一 个 贷 糊 集合 4 被 定义 为 : 

4= 人 EAIrEX} 《7.2 1) 
其 中 ，AaCc) 被 称 为 4 中 = 的 隶属 函数 《或 MEFE)，X 的 每 个 元 素 的 隶属 函数 对 应 的 隶属 
值 在 0~ 1 之 间 ， 

模糊 集合 具有 灵活 的 隶属 关系 ， 它 允许 在 一 个 集合 中 部 分 隶属 。 对 象 在 模糊 集合 
的 隶属 度 可 以 是 从 0 到 1 之 间 的 任何 值 ， 而 不 像 在 经 典 集 合 中 非得 是 严格 的 0 或 1。 这样 
模 半 集 合 就 可 以 从 “不 隶属 ”到 “ 求 属 ”逐渐 地 过 湾 。 这 样 像 “ 快 六 “ 惕 ” “扫兴 “ 淮 ” 
这 些 本 来 在 经 典 集 全 中 无 法 解 次 的 含 粳 概 念 名 可 在 模糊 集合 中 得 到 表达 ， 也 就 为 计算 机 处 
理 这 类 带 有 售 针 性 的 信息 提供 了 一 种 方法 。25 是 萎 还 是 热 ?》 用 经 典 集合 的 概念 回答 ， 这 
要 人 么 算 咀 要 人 么 算 热 ， 但 用 模糊 术语 回答 则 星 “ 两 者 都 有 些 ， 既 算 暖 又 算 热 ”" 换 句 话说 ， 
用 模糊 逻辑 判断 不 是 一 刀 切 或 者 黑白 分 明 ， 机 古 在 两 者 之 闻 连 续 渐变 。 才 面 看 这 种 含糊 是 
无 意义 的 ， 但 实际 上 却 可 通过 对 这 些 渐变 安排 特定 的 数字 ， 再 进行 模糊 逐 工 推理 而 消除 模 
狂 ， 假 如 把 25 它 作 这 样 的 分 类 ， 它 隶属 于 暖 的 程度 是 0.6， 同 时 来 属于 热 的 程度 是 0.4， 
然后 再 用 这 些 数值 去 得 到 对 问题 的 精确 解 。 

建立 在 槛 类 逻辑 基础 上 的 模糊 推理 是 一 种 近似 推理 ， 可 以 在 所 获得 的 模糊 信息 的 前 提 
下 进行 有 效 的 判断 和 决策 。 而 基于 二 值 逻辑 的 理解 力 推理 和 归纳 推理 此 时 却 无 能 为 力 ， 因 
为 它 要 求 前 握 和 结论 都 是 精确 的 ， 不 能 有 半点 含糊 。 模 糊 逻 辑 推 理 是 不 确定 性 推理 方法 的 
一 种 ， 其 基础 是 模糊 逻辑 ， 它 是 在 一 值 逻辑 三 段 论 的 基础 上 发 展 起 来 的 ， 它 与 传统 布尔 集 
合 论 进行 了 统一 处 理 ， 并 且 用 这 种 推 那 方法 得 到 的 结论 与 人 的 思维 一 致 或 相近 。 它 是 -- 种 
以 模糊 判断 为 前 担 ， 运 用 模糊 语 言 规则， 推出 一 个 新 的 近似 的 模糊 判断 结论 的 方法 。 

人 们 平常 如 果 遇 到 像 “ 如 果 * 小 ， 孝 么 》 就 大 ”这 样 的 前 担 ， 要 问 “ 如 果 x 很 小 ，》 
将 每 么 样 呢 ”， 我 们 会 很 自然 地 想到 “如 果 x 很 小 ， 邦 么 了 就 很 大 ”人们 所 使 用 的 这 种 推 
理 方 法 就 被 称 作 模糊 假 言 推理 或 似 然 推理 。 这 是 一 种 近似 推理 方法 。 

在 1975 年 ， 查 德 利 用 模糊 变换 关系 ， 提 出 了 模糊 逻辑 推理 的 合成 规则 ， 建 立 了 统一 
的 数学 模型 ， 用 于 对 各 种 模糊 推理 作 统一 处 理 。 模 糊 假 言 推理 是 作为 这 一 合成 规则 的 特殊 
情况 来 处 理 的 。 

在 模糊 控制 中 ， 所 使 用 的 控制 规则 是 人 们 在 实际 工作 中 的 经 验 。 这 些 经 验 一 般 是 用 人 
们 的 语言 米 归 纳 、 描 述 的 。 也 就 是 说 ， 愤 灶 控 制 规则 是 用 模糊 语言 老 示 的 。 通 常 的 模糊 控 
制 规则 用 下 面 三 种 条 件 语言 的 形式 来 表示 ， 例 如 ， 

人 号 如 香水 温 偏 高 ， 著 么 就 如 … 些 冷水 ; 

人 如 果 衣 服 很 胜 ， 那 么 洗涤 时 间 应 很 长 ， 否 则 洗 漂 时 间 不 必 太 长 ; 

介 如 果 温 度 偏 高 并 且 不 断 上 升 ， 那 么 应 如 大 压缩 机 的 制冷 量 。 

为 了 形式 化 和 数学 处 理 上 的 方便 ， 上 述 条 件 语 名 也 可 分 别 表 示 为 : 

促 如 果 Y 是 4， 那么 了 是 如 : 

人 如果 > 是 4， 那么 了 是 品 否则 了 是 忆 ; 

多 如 果 * 是 4 并 且 了 是 品 寿 么 是 妆 

模糊 推理 系统 是 建立 在 模糊 集合 、 模 灶 规 则 和 模糊 推 邓 等 概念 基础 上 的 先进 的 计算 系 
统 。 它 在 诸如 系统 建 模 、 自 动 控 制 、 数 据 分 类 、 决 策 分 析 、 专 家 系统 、 时 间 序 列 预测 、 机 
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器 人 控制 和 异 式 识别 等 众多 久 域 中 得 到 了 成 功 的 应 用 。 册 于 其 多 学 科 的 自然 属性 ， 模 类 推 
理 系 统 被 称 为 许多 不 同 的 各 字 ， 如 基于 模糊 规则 系统 、 模 糊 专 家 系统 、 模 糊 模 型 、 模 糊 联 
想 记忆 、 模 糊 逻 辑 控 制 器 ， 或 简单 地 称 之 为 模糊 系统 。 


7.2 模糊 集合 及 其 隶属 函数 


7.2.1 模糊 集合 的 定义 


在 经 典 集 人 台 论 中 ， 任 何 一 个 元 素 与 任何 -个 集合 之 闻 的 关系 ， 只 有 “属于 ”和 “不 属 
于 ”两 种 情况 ， 两 者 必 居 其 一 ， 而 且 只 居 其 - -， 绝 对 不 允许 模棱两可 。 比 如 “不 大 于 了 的 
自然 数 ” 昆 一 个 清晰 的 概念 ， 该 概念 的 内 普 和 外 延 均 是 明确 的 。 可 是 ， 我 们 也 经 常 遇 到 没 
有 明确 外 延 的 概念 ， 这 种 概念 实质 上 是 模糊 概念 。 例 如 ,“ 比 5 大 得 多 的 自然 数 ” 就 是 一 
个 模糊 概念 。 可 以 想象 ， 无 法 划 定 一 个 明确 的 界限 ， 使 得 在 这 个 界限 内 所 有 自然 数 都 比 5 
大 得 多 ， 而 界限 外 的 所 有 自然 数 部 不 比 5 大 得 多 。 只 能 说 某 个 数 属于 “ 比 大 得 多 ”的 程 
度 高 ， 而 另 一 个 数 属于 “ 比 5 大 得 多 ”的 程度 低 ， 比 如 50 属于 “ 比 5 大 得 多 ”的 程度 比 
10 属于 “ 比 5 大 得 多 ”的 程度 高 。 

仍 德 在 1965 年 把 经 典 集 合 中 的 汇率 对 集合 的 隶属 度 只 能 取 0 和 1 这 两 个 值 ， 推 广 到 
可 以 取 区 闻 f，]1] 中 的 任意 一 个 数值 。 即 可 以 用 隶属 度 定量 去 描述 论 域 w 中 的 元 素 符 合 概 
念 的 程度 ， 实 现 了 对 经 典 集 合 中 绝对 隶属 关系 的 扩充 ， 从 而 用 隶属 函数 表示 模糊 集合 ， 用 
模糊 集合 表示 模糊 概念 。 

王 面 是 对 模糊 集合 的 一 般 定 义 。 

设 也 为 一 可 能 是 离散 或 连续 的 集合 ，L 被 称 为 论 域 (Universe of Discourse)， 用 {9]} 表 
示 论 域 忌 的 元素 。 异 糊 集 合 赴 用 隶属 函数 来 表示 的 。 


定义 工 论 域 避 中 的 模糊 子 集 4， 基 以 隶属 函数 总。 为 表征 的 集合 ， 即 由 映射 : 
































1: 0 一 [0,]] 《7.3) 
确定 论 域 ! 的 一 个 模糊 子 集 4。 玉 ， 称 为 模糊 子 集 的 隶属 函数 ， 世 (四 称 为 & 对 4 的 孙 属 
度 ， 它 表示 论 域 尽 中 的 元 素 上 属于 其 模糊 子 集 4 的 程度 。 它 在 [0. 1] 闲 区 间 内 可 连续 取 值 ， 
隶属 度 也 吉 简 记 为 4(a。 

基于 模糊 子 集 4 和 隶属 函数 内， ， 做 如 下 几 点 说 明 : 

全 论 域 中 的 匹 素 赴 分 明 的 ， 即 尽 本 身 是 普通 集 侣 ， 只 是 ! 的 子 集 是 模糊 集合 ， 放 
称 4 为 心 的 模糊 子 集 ， 简 称 模糊 集 。 

筷 凡 (上 是 用 来 说 明 z 隶属 于 习 的 程度 的 。 凡 (四 的 值 越 接近 1， 表 未 从 属于 4 的 
程度 越 大 ;上 友之， 下 ， (四 的 值 越 接近 于 0， 则 表示 # 从 属于 4 的 程度 越 小 。 显 然 ， 当 鼎 ，( 器 
的 值 域 为 {10,1} 时 ， 求 属 函 数 岂 ,已 拉 变 为 经 典 集合 的 特征 函数 ， 模 类 集合 4 也 就 虹 变 
成 为 一 个 经 典 集 合 。 因 此 ， 下 以 这 样 来 概括 经 暴 集 合 和 模糊 集合 间 的 互 变 关 系 ， 即 模糊 集 
合 是 经 丰 集 合 在 概 伪 上 的 拓 广 ， 或 者 说 经 典 集合 站 模糊 集合 的 一 种 特殊 形式 ， 而 隶属 函数 
则 是 特征 函数 的 扩展 ， 或 者 说 ， 特 征 函数 只 是 隶属 函数 的 一 个 特例 。 

8 








坊 模 灶 集 合 完全 由 它 的 隶属 函数 米 刻 画 。 隶 属 函 数 是 异 糊 数学 的 最 基本 概念 ， 借 助 于 
它 才 能 对 异 糊 集合 进行 量化 。 正 确 地 建立 开 属 函 煞 ， 是 使 模糊 集合 能 够 怡 当地 表达 模糊 集 
合 的 关键 ， 瘦 利用 精确 的 数学 方法 潜 分 析 处 理 模糊 信息 的 基础 。 

下 面 以 人 对 室 次 (0OC “” 405 ) 的 感觉 为 例 ， 来 看 看 如 何 用 模糊 集合 天 示人 对 事物 和 
现象 形成 的 概 售 。 在 一 般 情 况 下 ， 大 部 分 大 都 把 15C 一 28 尼 的 室温 称 作 “ 舒 通 ” 的 温度 ， 
而 把 15 它 以 下 称 为 “ 凉 ”， 28C 以 2 “ 热 ” 用 经 典 集 合 米 定义 ， 如 图 7.1 所 示 ， 小 
于 15 尼 的 湿度 ， 哪 伯 是 14. 9C， 也 只 能 属于 “ 凉 ” 的 副 度 ，14. 9 与 15C 只 相差 0.1C， 
就 把 15C 归 为 “每 适 ”， 而 把 14. 为 “着 "”， 这 合理 吗 ? 显然 怠 大 的 感觉 而 言 ， 这 是 
不 恰当 的 。 才 用 模糊 集合 米 定 义 ， 生生 和信 站 于 全 生化 于 全 
度 的 特征 函数 来 摘 述 ， 模 类 集合 的 特征 函数 就 称 作 隶 属 函 数 (Membership Function) ， 
7.2 就 是 一 种 表示 方法 。 在 异 糊 逻辑 中 ， 与 人 的 感觉 一 致 ， 小 的 量度 次 化 只 突起 采油 
能 的 逐渐 变化 ，14.90C 与 15 尼 属于 同一 个 集合 的 程度 是 很 接近 的 。 这 种 情况 下 ，32 辫 被 
认为 属于 “舒适 ”的 程度 是 0.3， 还 同时 属于 “ 热 ” 的 程度 是 0.7。 由 此 可 见 ， 在 模糊 有 还 
工 系 统 中 ， 温 度 的 较 小 变化 ， 在 系统 摧 行 中 将 导致 一 个 比较 合乎 情理 的 变化 。 








10 15 20 2830 407 10 20 3032 40 人 oa 
图 7. 1 经 暴 集 人 的 特征 郑 数 图 7.2， 模 椒 集合 的 隶属 五 数 


7. 2.2 ”模糊 集合 的 表示 方法 


就 论 域 的 类 型 而 言 ， 模 类 集合 有 下 列 两 种 表示 方法 ; 
设 论 域 避 是 有 限 域 ， 即 也 = fo 2， 了 上 的 任意 一 个 模糊 集合 4， 其 隶属 
函数 为 瓦 4 下 )， F 一 1 2， 人 则 此 时 和 可 表示 成 : 


三 
辫 LACD 14 (7.43 


这 里 的 》， 并 不 表示 “ 求 生 Ge 也 不 是 分 数 ， 只 是 借用 来 表示 集合 的 一 种 方法 ， 
它们 只 有 符 己 意义， 表示 4 对 模糊 集合 的 求 属 程度 是 彤 ，( 嫩 ) 。 

例 7.1 设 宁 温 的 论 域 V = {f0C, IC,200C, 30C, 40C1， 模 糊 集 合 4 妻 示 “舒适 的 
温度 ”， 则 和 可 以 定义 为 : 


4= “舒适 的 温度 ”= po = 0.25/0 0.S710 +1.0120 +0.5730 40.25/40 


其 中 ， 分 式 的 含义 是 隶属 度 / 温度 估 ， 
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人 @@ 设 论 域 忆 是 无 限 集 合 ， 此 时 辟 上 的 一 个 模糊 集合 4 可 表示 成 
几 = 几 (1 (7. 引 
注意 ， 同 样 ， 这 里 的 上 不 再 胡 示 “积分 ”” 只 代表 一 种 记号 ;， AGO/ 的 意义 则 和 
有 限 请 况 是 一 致 的 。 


7.2.3 模糊 集合 的 并 、 交 、 补 运算 


模糊 集合 的 运算 种 类 很 和 多， 但 最 常用 的 还 要 数 模糊 集合 的 并 集 、 交 集 和 补 集运 算 。 模 
糊 集 合 由 隶属 函数 定义 而 成 ， 其 运算 也 可 以 由 隶属 函数 来 定义 。 设 4、 瑟 为 过 中 两 个 模糊 
集合 ， 求 属 函 数 分 别 为 上 4 和 点 有 ， 则 模糊 集合 理论 中 的 并 、 交 、 补 等 运算 可 道 过 它们 的 
隶属 函数 来 定义 。 

定义 2 4 与 五 的 并 集 记 作 4U， 其 隶属 函数 严 4UBg 对 所 有 ze 也 被 逐 点 定义 为 取 大 
运算 ， 即 

















HaUs(O = max{a(oD, AsGO=AAGOvsGO (7.6) 
定义 3 4 与 8 的 交集 记 作 从 个 召 ， 其 隶属 函数 请 if 对 所 有 ze 世 7 被 逐 点 定义 为 取 
小 运算 ， 即 


届 AnEN = minfAaCe ABC 人 = 天 4 入 天 () (7.7) 
定义 4 4 的 补 集 记 作 4 ， 其 隶属 函数 捕 : 对 所 有 aezy 被 逐 点 定义 为 
中 人) = 一 严 A( 区 (7.8) 


这 里 的 v 、A^ 符 号 称 为 查 德 算 子 ， 为 模糊 逻辑 中 的 运算 符号 ， 在 无 限 集合 中 ， 它 和 们 
分 别 表 示 sup 和 inf， 在 有 限 元 素 之 间 则 表示 max 和 min， 即 取 最 大 值 和 最 小 值 。 


7.2.4 模糊 集合 的 隶属 函数 


查 德 教授 在 196s 年 发 表 的 论文 《模糊 集合 》(Fuzzy Sets) 中 首次 提出 了 表达 事物 模 
糊 性 的 重要 概念 一 一 隶属 函数 ， 借 助 于 隶属 函数 可 以 表达 一 个 模糊 概念 从 “完全 不 属于 ” 
到 “完全 属于 ”的 过 波 ， 能 够 对 所 有 的 模糊 概念 进行 定量 雪 示 。 隶 属 函 数 的 提出 奠定 了 模 
糊 理 论 的 数学 基础 。 这 样 ， 像 “ 冷 ” 和 “ 热 ” 这 些 在 经 典 集合 中 无 法 解决 的 模糊 概念 就 可 
在 模糊 集合 中 得 到 有 效 表 达 ， 这 就 为 计算 机 处 理 这 种 语言 信 息 提 供 了 一 种 可 行 的 方法 。 

在 经 典 集 全 中， 特征 函数 只 能 取 0 和 1 两 个 值 ， 即 特征 函数 与 10，1) 相对 应 ， 而 在 模 
糊 集 合 中 ， 其 特征 函数 的 取 值 范围 从 两 个 元 素 的 集合 扩大 到 在 [0， 菇 区 间 连 续 取 值 。 为 了 
把 两 者 区 分 开采 ， 就 把 模糊 集合 的 特征 函数 称 为 束 属 函数 。 若 隶属 函数 的 取 值 只 取 0 和 1 
那么 模糊 集合 就 缩 简 成 经 典 集 合 。 从 这 个 意义 上 说 ， 模 糊 集合 的 隶属 函数 是 经 典 集 合 特征 
函数 的 扩展 和 一 般 化 。 模 类 集合 是 通过 隶属 函数 来 定义 的 ， 淮 确 地 确定 隶属 函数 是 运用 模 
糊 集 合理 论 和 解决 实际 问题 的 基础 。 隶 属 函数 的 确定 实质 上 是 人 们 对 客观 事物 中 介 过 渡 的 定 
性 描述 ， 这 种 描述 本 质 上 是 客观 的 。 但 因为 每 个 人 对 同一 模糊 概念 的 认识 和 理解 上 存在 差 
异 ， 困 此 又 含有 一 定 的 主观 因素 。 对 于 同一 个 模 烤 概 念 ， 不 同 的 人 会 建立 不 完全 相同 的 隶 
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属 函 数 。 所 以 从 理论 上 说 ， 即 使 根据 专家 的 经 验 确定 的 来 属 函 数 ， 这 种 没有 理论 化 的 方法 
也 不 能 保证 其 正确 性 ， 因 为 任何 人 的 经 验 和 知识 都 是 有 局 限 性 的 。 在 这 个 方面 ， 国 内 外 学 
者 已 经 进行 了 大 量 的 研究 ， 提 出 了 各 种 各 祥 的 确定 方法 ， 诸 如 模糊 统计 法 、 函 数 分 段 法 、 

二 元 对 比 排序 法 ， 对 比 平 均 法 、 滤 波 函 数 法 、 示 范 法 和 专家 经 验 法 等 等 方法 。 不 过 ， 在 实 
际 应 用 中 ， 虽 然 用 不 同方 法 确定 了 不 局 的 模 灶 集合 的 隶属 函数 ， 在 一 定 范 围 内 ， 尽 管 实现 
控制 过 程 的 细节 和 达到 目标 的 过 程 细 节 和 响应 时 间 可 能 有 差别 ， 但 模糊 逐 辑 控制 却 痢 能 实 
现 控 制 ， 达 到 预期 目标 。 换 句 话 说， 隶属 函数 的 确定 并 不 是 唯一 的 ， 允 许 有 不 同 的 组 合 。 

所 以 人 们 为 了 简化 计算 ， 很 多 模糊 逻辑 控制 的 隶属 函数 曲线 都 是 取 三 角形 。 实 际 上 ， 根 据 
模糊 统计 方法 得 到 的 隶属 函数 通常 都 是 钟 形 的 ， 所 以 三 角形 隶属 国 数 并 不 是 最 佳 画 数 ， 只 
是 一 种 近似 。 计 算 机 模拟 实验 发 现 ， 实 际 上 ， 隶 属 函 数 的 形状 会 很 微妙 地 影响 着 整个 模 精 
系统 的 过 程 , 例如 会 影响 单片机 实现 模糊 化 、 解 模糊 化 的 时 间 和 对 查询 表 存 储 空 间 的 要 求 。 
现在 普遍 采用 三 角形 、 梯 形 和 单 值钱 形状 《又 称 术 形 )， 是 因为 实践 证 明 它 能 并 足 一 般 要 
求 ， 又 可 简化 计算 ， 故 被 广泛 采用 。 

如 果 按 定义 ， 模 类 集合 的 隶属 函数 可 取 无 穷 多 个 值 ， 这 在 实际 使 用 中 是 难以 确定 的 ， 
所 以 一 般 可 进行 如 下 简化 : 把 最 大 适合 区 间 的 隶属 度 定 为 1.0， 中 等 适合 区 间 的 隶属 度 定 
为 0.5， 小 适合 区 闻 的 隶属 度 定 为 0. 25， 最 小 隶属 度 《 即 不 隶属 ) 为 0. 0。 再 对 一 些 常 用 
的 基本 求 属 图 形 进行 定义 。 基 本 的 隶属 函数 图 形 可 分 成 三 英 : 左 大 右 小 的 僵 小 型 下 降 函 数 
《通常 称 作 2Z 函数 )、 对 称 型 凸 函 数 (通常 称 作 开 函数 ) 和 右 大 左 小 的 偏 大 型 上 升 函 数 〈 通 
常 称 作 S 函数 )。 这 三 种 隶属 函数 的 形状 如 图 7?. 3 所 示 。 
上 











(a) ?函数 《by 工 I 函数 {c) S 函数 
图 7,3 基本 的 隶 局 函数 图 形 
最 简单 的 隶属 函数 基 三 角形 ， 它 是 用 直线 形成 的 ， 梯 形 隶 属 函 数 实际 上 是 出 三 角形 鹤 
顶 所 得 。 这 两 种 直线 形 隶 属 函 数 都 具有 简单 的 优势 ， 因 而 经 常 被 人 们 使 用 。 它 们 的 形状 见 


图 ?7.4 (ay 和 赂 7.4 (by)。 





0 2 4 6 8 10 0 之 入 6 8 10 


ta 三 角形 隶属 函数 《b) 简 形 隶属 函数 


图 7.4 直线 型 来 属 函 数 
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7.3 横 糊 遥 权 


7.3.1 二 值 逻 辑 、 多 值 逻 辑 和 模糊 逻辑 


研究 思维 形式 和 规律 的 学 科 叫 下 加 学 。 用 经 典 逻 辑 表达 命题 的 形式 如 “明天 将 会 下 雨 
是 真 ”， 甚 反而 则 是 “明天 将 不 会 下 雨 是 真 ”、 二 值 膛 辑 不 承认 有 任 全 过滤。 波兰 还 辑 学 家 
和 哲学 家 卢 卡 瑟 维 妆 〈Jj，Lukasiewicz) 桨 二 值 逻 辑 扩 展 成 三 值 逻 辑 ， 即 加 上 了 外 一 种 
表述 “明天 将 下 雨 是 可 能 的 ”， 这 种 表述 的 逻辑 值 是 172， 他 用 1 表示 真 ，0 表示 假 ， 另 外 
用 172 表示 可 能 性 ， 这 看 起 来 好 像 仅 仅 是 搬入 了 一 个 值 ， 然 而 却 是 一 个 帘 破 ， 因 为 由 此 而 
产生 了 多 值 丈 辑 。 

多 值 膛 辑 否定 了 逻辑 真 值 的 绝对 两 极 性 ， 认 为 逻辑 真 值 具 有 离散 的 中 间 过 渡 ， 似 乎 在 
某 种 程度 上 具有 共 此 亦 彼 性 。 但 是 才 值 四 辑 是 通过 穷 举 中 介 的 方式 表现 这 种 过 小 性 ， 把 所 
有 中 介 看 成 是 若干 完全 分 立 离散 、 界 限 分 明 的 对 象 ， 而 不 头 认 相 邻 中 介 是 相互 滤 透 、 变 叉 
重要 的 。 因 此 ， 多 值 逐 辑 本 质 上 仍然 属于 精确 膛 董 ， 而 不 是 真正 的 亦 此 亦 彼 的 辑 。 

模糊 还 辑 是 在 卢 卡 斯 维 兹 多 和 便 贤 辑 基础 上 发 展 起 来 的 ， 如 前 所 述 ， 多 值 远 辑 中 命题 
的 真 值 可 取 众 0 到 1 之 间 的 任何 值 ， 但 此 值 是 确切 的 。 然 而 在 许多 情况 下 ， 要 给 命题 的 真 
实 程度 赋予 确切 数值 也 是 困难 的 。 但 是 人 们 用 某 些 约定 的 模糊 语言 却 能 对 横 糊 命题 给 予 贴 
切 的 描述 ， 这 些 语 言 虽 然 不 是 精确 的 ， 然 而 介 互 之 闻 却 都 能 理解 接受 ， 并 且 一 般 不 但 不 会 
引起 误解 ， 上 反而 显 香 更 贴 雪 有 效 ， 体 现 了 人 脑 模 类 思维 的 逐 和 加 特 征 。 这 说 明 这 些 模糊 语音 
具有 玩 辑 真 值 的 功能 。 由 此 用 有 模糊 限定 算 子 〈 例 站 ， 很 、 略 、 比 较 、 非 常 等 的 从 自 
然 语 言 中 提炼 出 来 的 语言 真 值 (如 年 轻 ， 非 常年 轻 等 ) 或 者 模糊 数 (例如 ， 大 约 25、45 左 
右 等 ) 来 代替 值 肥 辑 中 命题 的 确切 数字 真 值 ， 就 构成 模糊 语言 还 辑 ， 遂 常 就 简称 为 模糊 
还 辑 。 在 经 典 二 值 膛 辑 中 实际 上 也 有 语言 真 什 ， 那 就 是 真 和 假 ， 伍 是 在 模糊 趟 辑 中 则 有 无 
穷 多 个 语言 真 值 。 








7.3.2 模糊 逻辑 的 基本 运算 


模糊 逻辑 的 基本 运算 有 以 下 $ 种 : 

全 模糊 逻辑 “ 补 ”， 五 =1- 忆 

名 模糊 逻辑 “ 取 小 ” 忆 AC=min(P,O) 《 取 两 个 真 值 中 小 的 一 个 ) 
《对 应 于 二 值 还 和 毕 中 的 “与 ” 

人 @) 模 糊 逻 辑 “ 取 大 ” 忆 v 吕 =max(PO) 《 取 两 个 真 值 中 大 的 一 个 ) 
(对 应 于 … 值 逻辑 中 的 “或 六 

二 模糊 逻辑 “蕴含 ” 斑 =- 由 v) 和 1 

岛 模糊 丈 辑 “等 价 ”， 厂 所 人 @=(P 一 个) 和 ( 台 一 了) 

除 这 5 种 运算 外 ， 为 模糊 还 辑 运 算 又 定义 了 3 种 限界 运算 。 
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半 各 个 居 素 而 言 ， 分 别 相 如 ， 相 加 后 的 值 比 1 小 的 作为 限界 和 ， 而 把 大 于 1 的 部 分 作 


为 限界 积 。 
塌 模 糊 贤 辑 限界 积 ; 忆 国 @=(P+O-TDv0=max((+ 吕 -1.0) 
他 懂 糊 还 得 限界 和 : 瑟 CQ=(P+BDAL=min(P+O.D 
他 异 糊 逻辑 限界 差 : P-C=(P-oOv0 


因为 二 值 逻 辑 真 值 只 能 取 0 或 者 1， 它 除了 可 以 用 解析 法 进行 处 至 化 简 外 ， 还 有 出 较 
直观 的 真 值 表 几 解 形式 的 卡 计 网 方法 。 模糊 丈 辑 公 式 常 称 为 横 糊 逻辑 函数 。 山 于 模糊 逻辑 
孙 数 可 在 从 0 到 1 区 间 记 任意 值 ， 所 以 模糊 逻辑 公式 就 不 能 用 传统 的 卡 诺 岁 方法 ， 而 只 能 
用 解析 法 Yeiteh 图 的 推广 模糊 图 来 处 理 ， 这 在 实际 应 用 中 会 带 来 困难 。 所 以 为 了 简 
化 处 理 ， 又 常 把 槛 糊 函 数 变 量 分 成 若干 有 跟 段 ， 这 样 就 可 用 多 值 轴 辑 的 方法 米 处 理 模糊 逻 
辑 的 问题 。 

根据 以 上 模糊 还 苷 函数 运算 的 定 多 ， 可 以 推导 出 横 糊 还 辑 函 数 的 下 列 基 本 公式 : 

心 展 等 律 : 产 v 天 = 呈 





己 人 瑟 = 户 

名 交换 律 ， 已 v 台 = 双 v 也 
五 总 = 人 五 

地 结合 律 : PvOvR)=(PvO)v 员 


有 A{GA 二 =(A 人 和 有 
晤 吸收 律 : Pv(PA 钝 = 书 





PAfPvO)= 书 
电 分 配 律 : PvIGAx 了 =(PvOA(CPv 身 《7.9) 
王 A(GY 天 一 (AIv(PEAD 
国 双 否 律 : PP= 忆 
信德 * 摩 根 律 : Pv8= 亚 人 吕 
产 人 妇 =PvD 


地 常数 运算 法 则 : livP=1l 0vP= 己 
1AP=0 1AP=0 
这 里 特别 要 注意 的 是 ， 在 二 值 逻 辑 中 有 互补 律 ， Pv P=1， 成 ^ 五 =0。 但 是 在 模糊 
膛 辑 中 漫 有 互补 律 ， 因 为 
PvP=max( 瑚 1- 站 
已 已 =minf(P,1- 间 (7.10) 
并 且 一 般 说 米 前 者 不 等 于 1 ， 后 者 不 等 于 0 。 
利用 这 些 基本 公式 就 可 化 简 模 糊 轩 辑 函 数 ， 以 便 根 据 化 简 得 到 的 结果 来 组 成 最 简 模 精 
贤 辑 电路 。 这 具有 非常 重要 的 现实 意 尽 。 
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7.3.3 模糊 关系 和 模糊 德 阵 


描述 元 素 之 问 是 否 相 关 的 数学 懂 型 称 为 关系 ， 描 述 模 糊 元 素 之 间 相 关 程 度 的 数学 模型 
称 为 懂 糊 关系 。 为 了 区 别 于 模糊 关系 ， 又 称 关 系 为 普通 关系 。 显 然 ， 模 糊 关 系 在 普通 关系 
的 拓展 和 发 展 , 而 普通 关系 可 视 为 模糊 关系 的 特例 。 模 糊 关 系 是 模糊 数学 的 重要 组 成 部 分 。 
当 论 域 有 限时 ， 末 用 模糊 矩阵 表示 模糊 关系 。 模 糊 丐 阵 为 模糊 关系 的 运 答 带 来 了 极 大 的 方 
便 ， 成 为 模糊 关系 的 主要 运算 工具 。 

下 面 症 关于 模 灶 关 系 的 定义 。 

定义 5 集合 局 与 六 之 间 的 坦 积 


局 xy 一 fo 人 


中 的 一 个 模 糙 子 集 只 被 称 为 已 到 下 的 模糊 关系 ， 又 称 为 二 元 模糊 关系 ， 其 特 任 可 以 则 下 
面 的 隶属 也 数 来 描述 : 





xzEtyey} (7.10 


AR: XxTY 一 [OH] (7.12)》 
在 论 域 了 = 时， 称 8 为 如 上 的 模糊 关系 ， 当 论 域 为 五 个 集合 本 (7T=1 2 .2) 
的 直 积 册 xu2zx,xen 时 ， 它 们 所 对 应 的 模糊 关系 郧 则 称 为 了 元 模糊 关系 。 
不 同 乘积 空间 上 的 模糊 关系 可 以 通过 复合 运算 结合 在 一 起 。 模 糊 关 系 复 合 运算 已 经 
提出 了 者 干 种， 茸 和 内 型 的 是 由 查 德 所 提出 的 最 大 一 最 小 复合 运算 ， 其 定义 如 下 : 
定义 6 设 品 和 3 分 别 为 已 xY 和 Fx 风 上 的 模糊 关系 。 所 谓 吕 和 了 的 合成 ， 是 指 下 列 
定义 在 尽 x 钱 上 的 模糊 关系 ， 记 作 尺 so8 : 
妨 o0 人 一 有 Rob 二 IDaITninARGe As 
一 YURU， 中 ALsO2sm)} 








(7.13) 


这 里 入 代表 到 小 〈min)，Y 代表 取 大 (max)。 

尽管 最 大 一 最 小 复合 运算 得 到 了 广泛 的 点 用 ， 但 是 很 准 对 其 进行 数学 分 析 。 为 了 增强 
数学 分 析 及 实现 的 能 故 ， 在 模糊 关系 的 合成 中 ， 常 用 乘法 代 珍 最 大 一 最 小 复合 运算 中 的 取 
小 运算 ， 获 得 最 大 一 乘积 (max-product ) 复合 运算 ， 即 : 

有 人 Reg 人 二 YARG DeHS(CP mW] 《7.14) 

因为 如 和 之 问 的 模糊 关系 是 定义 在 xy 上 的 异 糊 子 集 ， 国 此 ， 模 糊 集 合 之 间 的 运 
算 能 够 直接 利用 模糊 关系 运算 。 例 如 ， 设 吊 5 是 xyY 上 的 横 糊 关系 ， 则 有 : 

外 并 集 民 US 二 一 有 RUS 四 = 下 R( 本 站 VS 全 

已 交 和 集 丸 门 8 后 一 RS 有 三 下 Re 内 Ac 

区 补 集 ”只 全 一 殿下 ( 本 从 =1 一 几 ER (7.15) 

出 等 价 关 系 。 民 三 8 e 一 吕 六 (全 办 =AgfePvzEEyEy 

已 包含 关系 尺 E8e 一 ERtNSHSDhvaeEEpEY 

模糊 关系 通 币 可 以 用 模糊 矩阵 、 模糊 图 和 模 类 集合 表示 法 等 形式 来 表示 。 和 通常 用 模 
精 矩 阵 来 表示 二 元 模 糊 关 系 。 
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模糊 矩阵 的 定义 如 下 : 
当 区 ={g|E=1 2 和 = 人 =12…, 几 是 有 限 集合 时 ， 尽 xy 的 模糊 关系 吕 


可 用 下 列 天 X 下 阶 算 阵 米吉 示 





门 ] 门 2 门 六 
所 Po 

Rs 2 2 2 (7.16) 
Pal mn2 Jan 


上 式 中 ， 元 素 六 =ARGsiv 门 。 由 此 表示 模 灶 关 系 的 抵 阵 ， 被 称 为 异 糊 失 阵 。 由 于 
AR 的 取 值 区 闻 为 [0，Ii， 因 此 模糊 托 阵 元 素 后 的 但 也 在 [0，j1] 区 疝 。 显 然 ， 异 糊 算 阵 
二 普通 矩阵 的 特例 。 当 画 = 2 时 ， 称 中 为 卫 阶 模 炎 方 阵 ;省 广 全 为 6 时 ， 称 兄 为 零 矩 阵 ， 
记 为 0: 当 噩 全 为 1 时 ， 称 中 为 爹 拓 阵 ， 记 为 及 当 方 只 在 区， 二 中 取 值 时 ， 称 有 为 布尔 
矩阵 ， 它 对 应 一 个 普通 关系 。 

由于 模糊 鹅 阵 本 身 是 表示 一 个 模糊 关系 子 集 ， 因 此 根据 模糊 集 的 交 、 并 、 补 运算 定义 ， 
模糊 矩阵 也 可 作 相 应 的 运算 。 

例 了 .2 最 大 一 最 小 和 最 大 一 乘积 的 复合 运算 。 

设 吕 =“ 与 相关”， 3 = “与 风 相关” 是 分 别 定 义 在 忆 xY 和 Yx 环 上 的 两 个 模糊 
关系 ， 其 中 心 = 人 2.3，Y= 圳 ,86 ，W =fa8， 假 设 只 8 以 如 下 的 关系 矩阵 来 表 
示 : 

如 改 


CRB 7 6 0 
0.1 03 05 07]1 0 0 
“104 02 08 09|2 ， = 0 0 有 
0.6 08 03 02|3 5 06|7 
0.7 0.2|5 





现在 计算 员 oS， 它 的 依 义 是 基于 玉 和 $ 导 出 的 模糊 关系 “zx 与 W 相关” 
如 果 采 用 最 大 一 最 小 复合 运算 的 合成 方法 ， 可 得 





0.9 0.1 

0.1 0.3 0.5 0.7 02 03 

员 pog =10.4 02 08 09|。 5 05 
0.6 08 03 02 

07 0.2 


(0.4^09v(02A02)v(08A05)v(09A07) (04A0.Dv(02A03)v(08A0Gv(09A02 
(0.6A0.9Y(0.8A02v(03A05)v(02A07] (0.6A0DJv(08A03v(03A06)v(02A0 们 
a hb 
07 0.5]1 
了 0.6|2 
06 03|3 
另外 ， 如 果 采 用 最 大 一 乘积 合成 法 ， 则 有 : 


〖 A0 另 vt03A03Yv(05A05vI(07A07 (0.1A0.Dv(03A03v(05A06Iv(07A02 
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0.9 0.1 
0.1 03 05 07 
02 0.3 
ppog=|04 02 08 09|。 
.6 08 03 0.2 
0 07 02 


(0.4*09Jvt0.2*0.2)v (0.8*0.5)v10.9x0.7 【0.4*0.Dvr02*0.3v(0.8x0.6)v(0.9*+0.2 
(0.6*0.9)v10.8#0.2jv(0.340.5)v(D0.280.7) 《0.56*0.Dvf0.8s0.3]vI03*0GTv0.2*0.2) 
ER oo 


〖 .91 v (0.3* 昌 .2] Y 0.5<O0.3YTO.7#0.7) 《0.1*0.DvtD.3+0.3)Y(OSx0.6)v (0.7*0.2) 


0.36v004v040v063 004v006v048v0.18 
0.5S4v0.16v01Sv014 006v024v018v0.04 
起 


0.49 03011 
一 |0.63 04812 
3 


0.54 0.24 


风 7.5 所 示 为 两 个 模糊 关系 的 合成 ， 其 中 辟 中 
元 素 2 和 好 中 元 素 a 之 间 的 关系 ， 由 连接 这 2 个 
元 素 的 4 条 可 能 路 径 〈 实 线 》 表示 。2 和 a 之 间 的 
相关 上 度 为 这 4 条 路 径 强 度 的 最 大 值 ， 而 每 条 路 径 的 
强度 等 于 各 元 素 连 接 强 度 的 极 小 值 〈 或 乘积 )。 





图 7.5 模糊 关系 的 图 形 囊 示 
7. 3. 4 模糊 语言 及 其 算 子 


模糊 逻辑 原则 土 是 一 种 模拟 人 类 思维 的 逻辑 。 人 在 日 常生 活 中 相互 交流 信息 时 ， 用 
的 是 自然 语言 。 自 然 语言 是 指 人 们 在 日 常生 活 和 工作 中 所 使 用 的 语音 ， 实 际 上 是 以 字 或 词 
为 符号 的 一 种 符号 系统 。 自 然 语 言 的 奇妙 作用 就 是 用 带 有 模糊 性 的 词句 ， 对 客观 现象 和 事 
物 作出 概括 性 反应 ， 使 得 人 可 以 用 最 少 的 言辞 传递 最 大 的 信息 量 。 自 然 语言 可 以 对 连续 性 
变化 的 现象 和 事物 进行 概括 抽象 并 作 模 糊 分 类 ， 例 如 ， 早 居 、 上 午 、 中 午 、 下 午 和 偿 噶 、 
晚上 和 夜里 等 ， 另 外 这 里 有 个 约定 俗 成 的 “常识 ”在 起 作用 ， 所 用 的 言辞 直接 与 现实 世界 
相对 应 。 这 就 是 说 ， 自 然 语言 具有 有 活性 。 

人 类 使 用 的 词语 是 如 此 丰富 的 资源 ， 使 人 难以 割 含 。 在 模 灶 罗 辑 中 ， 采 用 词语 和 模 
糊 语 言 。 在 实际 中 ， 通 常 首先 要 对 问题 进行 初始 化 ， 随 后 对 其 进行 参数 调整 ， 在 这 一 过 程 
中 ， 词 语 起 着 较 大 的 作用 。 从 这 个 角度 来 看 ， 模 灶 语 言 是 用 来 达到 计算 目的 的 一 种 平 段 。 
进行 计算 就 是 将 输入 转化 成 输出 ， 或 将 原因 转化 成 结果 ， 或 将 问题 转化 成 答案 ， 任 何 与 自 
然 语言 的 匹配 均 只 是 手段 而 不 是 目的 。 目 的 大 设计 系统 和 解决 问题 。 

要 想 用 机 器 来 模仿 人 的 思维 、 推 理 和 判断 ， 也 必须 引入 语言 变量 。 查 德 教授 在 1975 
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-一 一 sosnr 





年 提出 了 语言 变量 的 概念 ， 语 言 变 基 实际 上 是 一 种 模糊 变量 ， 它 用 词 铝 而 不 是 用 数字 米 表 
示 变 量 的 “ 值 ” 

通常 ， 把 含有 模糊 概念 的 语言 称 为 模糊 语言 。 查 德 首先 从 语义 角度 对 自然 语言 进行 集 
合 描述 , 给 出 了 一 个 集合 描述 的 语言 系统 。 模 糊 语言 也 具有 它 自己 的 组 成 要 素 和 语法 规则 。 

1) 单词 

单词 吓 语 言 构成 的 基本 要 素 ， 也 号 表达 概念 的 最 小 单位 ， 因 此 也 称 为 原子 单间 。 它 号 
不 可 分 割 乓 ， 如 “天 内“ 地 ” “人 ” “日 和 “上 月 ”等 。 对 于 一 个 给 定 的 论 城 w， 与 避 相 
关 的 一 类 单词 就 构成 了 一 个 集合 4。 语 义 是 通过 4 到 忆 的 对 应 关系 中 求 航 达 的 ， 有 通常 
是 一 个 模糊 关系 。 对 于 任意 一 个 固定 的 单词 weA4 ， 中 作 : 


慌 (C 本 一 开 A( 《7.17) 


上 式 表 示 的 是 论 域 避 上 的 一 个 模糊 子 集 ， 并 用 大 写字 母 4 表示 与 & 对 应 的 关系 。 若 





设 : 
下 员 4XE 一 四 沾 
其 隶属 函数 Hata, 四 表示 属于 集合 4 的 单词 w 利 属于 论 域 局 上 无 素 za 之 问 关 系 的 程度 。 
例如 ， 说 论 域 区 为 夏天 气 旭 ， 单 词 实 为 “高 温 ”， 元 素 & 为 “日 最 高 气温 ”， 则 有 : 
有 fa3953C)=02: 4236C)=04 Hafa37C)=D6; 
HG38T)=08 439C)=09，H4f0.40TCC)= 1.0。 
这 里 ， 模 糊 子 集 4 为 : 
02 04 06 08 09 10 
点 = 一 一 十 一 一 十 十 十 十 
35 36 37 38 39 4 可 
由 于 “高 温 ” 本 身 是 一 个 模糊 性 单词 ， 因 此 ，w 称 为 “模糊 的 >。 如 果 论 域 凡 和 元 素 
2 均 不 变 ， 改 变 单词 久 为 “高 于 37C 气 温 ?， 则 : 
Ha4a3sSTJ=D AQ36TC)=0 HA 37TC)=0: 
HAfC38C)=1 AQ39TC)=1 4G4OC)= 1。 
此 时 ， 横 糊 集 合 4 退化 为 一 个 清晰 集合 ， 凤 : 
4=(38TC，39C，40T] 
而 这 里 的 “高 于 37 气温 ”是 一 个 清晰 的 概念 ， 因 此 rw 是 “清晰 的 ” 
2) 词组 
由 连接 词 “ 或 上“ 且 ” 将 两 个 或 多 个 单词 相连 接 ， 或 者 在 单词 前 面 加 “ 非 >， 即 可 构 
成 词组 。 这 些 连 接 词 在 下 辑 上 分 别 对 应 于 集合 运算 的 品 、 和 和 非 。 例 如 ; 
人 三 男人 或 女人 =[ 男 人 JU[ 女 人 ] 
非 机 动车 =f 机 动 】 六 (车子 ] 
由 上 例 可 知 ， 单 词 可 以 组 全 成 词组 ， 词 组 可 以 分 解 为 单词 ， 它 们 可 以 统称 为 “ 词 ” 
3 ) 语言 算 子 
为 了 对 模 烦 的 自然 语言 形式 化 和 定量 化 ， 进 一 步 区 分 和 刻画 模糊 值 的 程度 ， 常 常 还 
借用 自然 语言 中 的 修饰 词 ， 诸 如 “非常 ". “比较 ” “极其 ” 壕 有 “ 梢 徽 “相当 ” “大 
约 ”“ 近 似 、“ 倾 问 于 ” 米 描述 模糊 值 。 为 此 引入 请 冲 算 子 的 梳 念 。 语 关 算 子 通常 又 可 分 
为 三 类 : 话 气 算 子 、 模 糊 化 算 子 和 判定 化 算 子 。 

















37 


【1) 语气 算 子 

语气 算 子 用 于 表达 模糊 值 的 肯定 程度 。 这 又 可 分 为 两 种 情况 : 一 种 是 有 强化 作用 的 
语气 算 子 ， 例 如 “很 从 “ 极 ” 等 ， 可 以 使 模糊 值 的 素 属 度 的 分 布 向 中 央 集 中 ， 和 常 称 为 集中 
化 算 子 , 集中 化 算 子 在 图 形 上 有 使 模糊 值 尖 锐 化 的 倾向 ; 另 一 种 是 有 弱化 作用 的 语气 算 子 ， 
例如 “ 较 小 “稍微 ”等 ， 可 以 使 模糊 值 的 隶属 度 的 分 布 由 中 央 向 两 边 弥散 ， 和 常 称 为 松散 
化 算 子 。 松 散 化 算 子 在 图 形 上 有 使 模糊 俯 平 坦 的 倾向 。 


为 了 规范 语气 算 子 的 意义 ， 查 德 曾 对 此 作 了 如下 约定 : 用 豆 x 作为 语气 算 子 来 定 莉 描 


述 模糊 值 。 若 模糊 值 为 4， 则 把 吾 ;: 定义 成 


五 1 = 44 (7.19) 
设 互 4 代表 “ 极 ” 或 者 “非常 非常 *”， 其 意义 是 对 描述 的 模 灶 值 求 4 次 方 ; 
设 问 代表 “很 ”或 者 “非常 内 其 意义 是 对 描述 的 模糊 值 求 2 次 方 ; 
设 五,。 代表“ 较 ” 或 者 “相当 ” 其 意义 是 对 描述 的 模糊 值 求 172 次 方 ; 
设 刀 ， 代 表 “ 稍 ”或 者 “ 咯 微 ">， 其 喜 义 是 对 描述 的 模糊 值 求 1/4 次 方 ; 
例如 ， 论 域 5 一 上 0, 200]， 而 O 表示 单词 “年 老 ” 那么 〔〈 五 ; 如 ) 随 着 4 取 不 同 的 值 ， 

就 可 以 表示 出 “年 老 ” 的 程度 。 

当 刀 >] 周 ， 不 妨 设 五 | 25 为 “相当 六 瑟 > 为 “很 ” 万 4 为 “ 极 ”， 则 


妨 自 三 呈 入 90 
[相当 老 ](s) = Th 站 es 
0 ， bb<2<590 
[ 很 老 ](z0 = | 50<n<S200 
0 0O<uw<50 


_ 2] 
[ 极 老 Jo = Pr( 浊 | 50<w<200 
当 和 <1 时 ， 不 妨 设 扩 。 2 为 “ 微 ”, 吾 0s 为 “ 略 ”” 所 ,为 “比较 ” 则 


0 0<t<s30 


_ 十 025 
[ 微 老 ]G0) = 到 50<w<200 
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ie ind 


0 唱 科 衬 9 


略 老 ](o) = 2 
[各 区 二 50<w<s200 


人 0 大 玉生 50 


二 
1+[ < 50<w<200 


注意 语气 算 子 大 在 针对 隶属 函数 为 指数 型 本 数 时 得 出 的 。 若 采用 其 他 如 三 角形 或 梯 
形 隶 属 函 数 ， 此 算 子 不 起 作用 。 

由 于 束 属 函数 的 取 值 范围 在 闭 区 间 [0, 1]， 由 于 集中 化 算 子 的 舍 乘 运算 的 次 数 大 于 |， 
乘 方 运算 后 变 小 ， 即 隶属 函数 曲线 趋 于 尖锐 化 ， 而 且 笑 次 越 高 ， 曲 线 越 尖锐 ， 相 反 ， 松 散 
化 算 子 的 圭 次 小 于 1， 乘 方 运算 后 变 大 ， 隶 属 函 数 曲 线 趋 于 平坦 化 ， 而 县 宕 次 越 高 越 平坦 。 

(2) 模 精 化 算 子 

诸如 “大 约 ” “近似 ” 等 这 样 的 修饰 词 都 属于 模糊 化 算 子 ， 其 作用 是 把 肯定 转化 为 模 
炎 ， 如 果 对 数字 进行 作用 ， 就 把 精确 数 转化 为 模糊 数 。 例 如 数字 65 是 精确 数 ， 而 “大 约 
65” 就 是 模糊 数 。 如 果 对 模糊 值 进行 作用 ， 就 是 模糊 值 的 模 钴 ， 例 如 “年 轻 ” 是 个 模糊 值 ， 
而 “大 约 年 轻 ” 就 变 得 更 模糊 。 

在 模糊 控制 中 ， 采 样 的 输入 是 总 是 精确 量 ， 要 利用 模 壮 逻辑 推理 方法 ， 就 必须 首先 把 
输入 的 精确 量 模 糊 化 。 模 糊 化 实际 上 就 是 使 用 模糊 化 算 子 来 实现 的 。 所 以 ， 引 入 模糊 化 算 
子 是 非常 有 实用 价值 的 。 

{《3) 判定 化 算 子 

与 模糊 化 算 子 有 相反 作用 的 另 一 类 算 子 ， 例 如 “ 倾 向 于 兴 “偏向 于 ”等 ， 被 称 为 判定 
化 算 子 。 甚 作用 是 可 把 横 糊 值 进 行 肯定 化 处 理 ， 对 模糊 值 作出 颁 内 性 判断 。 其 处 理 方 法 有 
点 类 似 于 “四 舍 所 入 ”， 并 常 把 隶属 度 为 0.5 作为 分 界线 来 判断 。 

山 于 语言 变量 适用 于 表达 那些 由 于 过 分 复杂 而 无 法 获得 确定 信息 的 概念 和 现象 ， 它 为 
这 些 道 常 无 法 进行 定量 化 的 “ 量 ”提供 了 一 种 近似 处 理 方法 。 通 过 这 种 处 理 方 法 ， 就 可 把 
人 的 直接 经 验 进行 量化 ， 转 换 成 用 计算 机 可 以 操作 的 数值 运算 。 由 此 才能 使 人 们 有 可 能 把 
专家 的 控制 经 验 转换 成 控制 算法 并 实现 模糊 控制 。 


7.4 模糊 规则 与 模糊 推理 


[比较 老 ](oo = 








7.4.1 模糊 “如 果 一 那么 ”规则 


模糊 规则 是 对 自然 或 人 工 语 言 中 的 单词 和 名 子 定量 建 模 的 有 效 工 具 。 通 过 将 模糊 规划 
理解 为 恰当 的 模糊 关系 ， 我 们 可 以 研究 不 同 的 模糊 推理 方案 ， 用 基于 符合 推理 规则 的 推理 
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过 程 ， 从 一 组 模糊 规则 和 已 知事 实 中 推 得 结论 。 避 糊 规则 和 模糊 推理 是 模糊 推理 系统 的 基 
础 ， 是 懂 糊 集合 理论 最 重要 的 建 模 工 具 ， 它 们 吕 被 成 功 广 谣 地 应 用 于 各 个 领域 。 

模糊 “如 果 一 那么 ”规则 《也 称 为 模糊 规则 、 模 糊 落 含 或 模糊 条 件 句 ) 的 形式 为 : 

如 果 Y 嘴 4， 那 么 y 十 号 《7.19) 

其 中 ，4 和 召 分 别 是 论 域 X 和 了 上 的 模糊 集合 定义 的 语言 值 。 通 常 称 “x 是 4” 为 前 件 或 
前 提 ，“?y 是 互 ”为 后 件 或 结论 。 

模糊 系统 或 控制 的 基本 单元 是 “如 时 一 那么 ”规则 :“ 如 果 水 温 偏 高 ， 那 么 就 多 加 一 
些 冷水 ”或 “如 果 充 服 很 胜 ， 闭 么 洗涤 时 间 应 很 长 ， 否 则 洗涤 时 间 不 必 太 长 ”一 个 模糊 
系统 是 一 个 “如 果 一 那么 ”规则 的 集合 ， 这 些 规则 将 输入 映射 到 输出 。 每 一 个 规划 映射 输 
入 的 一 部 分 到 答 出 的 一 部 分 。 它 将 像 “ 偏 高 的 水 温 ” 这 和 样 的 条 入 模糊 集 映射 到 像 “ 较 多 的 
冷水 ”这 样 的 输出 模糊 集 。“ 偏 高 的 水 涅 ”是 模糊 的 ， 这 是 因为 水 的 刘 度 是 “ 仿 商 ”还 是 
“ 偏 低 ”部 只 是 某 种 程度 。 一 个 单独 的 规则 “如 果 水 误 偏 高 ， 那 么 就 多 加 一 些 冷 水 ”自身 
人 恒定 义 了 一 个 常数 孙 数 或 线性 段 。 玖 合 的 规则 可 以 定义 出 冤 项 式 或 更 复杂 一 些 的 孜 数 。 

模糊 系统 的 发 展 是 从 词语 到 句子 到 段落 。 词 意 代 表 集 台 。 名 词 “ 水 温 ” 代 表 着 一 个 集 
合 或 水 的 一 个 子 集 。 “水 温 ” 这 个 集合 可 能 有 模糊 或 灰色 边界 ， 但 并非 必 霸 。 有 形容词“ 高” 
和 “很 高 ”代表 水 温 集合 的 模糊 子 剑 。 因 此 ， 名 词 短 语 “ 偏 高 的 水 温 ” 代 表 一 个 模糊 集 ， 
“ 较 多 的 冷水 "这 个 名 词 短 语 同样 也 代表 一 个 模糊 集 。 我 们 可 以 用 曲线 来 模拟 这 些 模 糊 集 ， 
击 不 是 用 撼 形 ， 这 些 曲线 可 以 是 三 角形 、 榜 形 或 钟 形 曲 线 。 像 “如 果 水 温 偏 高 ， 那 么 就 多 
加 一 些 冷 水 ”这 样 的 一 个 完 束 句子， 就 代表 着 一 个 模糊 规则 或 如 果 部 分 的 模糊 集 “ 偏 高 的 
水 温 ” 和 那么 部 分 的 模糊 集 “ 较 多 的 冷水 ”之 间 的 模糊 联系 。 这 样 的 一 条 规则 定义 了 一 个 
模糊 输入 /输出 状态 空间 的 一 个 子 集 ， 这 种 句子 的 列表 定义 了 一 个 异类 系统 或 异类 规则 集 ， 
这 些 集合 覆 盖 了 某 个 函数 或 某 个 函数 族 。 增 加 或 减少 规则 ,就 可 对 慌 糊 系统 进行 宏观 调控 。 

在 我 们 使 用 模糊 “如 果 一 孝 么 ”规则 对 系统 进行 推理 和 分 析 之 前 ， 必 须 将 表达 式 “ 如 
果 x 是 4， 那么 了 十 电 (或 缩写 为 4 一 下 )” 的 意义 形式 化 。(7.19) 式 所 描述 的 是 两 个 变 
量 zw 7 之 间 的 关系 ， 这 意味 涛 模糊 “如 果 一 那么 ”规则 可 以 定义 为 匀 积 空间 慎 XY 上 的 二 
元 模糊 关系 届 。 



























































7. 4. 2 模糊 逻辑 推理 


从 已 知 条 件 求 其 结果 的 思维 过 程 就 是 推理 。 用 传统 的 二 值 膛 辑 进 行 假 言 推理 和 蚂 纳 扒 
理 时 ， 只 要 大 前 提 或 者 推理 规则 是 正确 的 ， 小 前 提 是 肯定 的 ， 那 么 就 一 定 会 得 到 肯定 的 结 
论 。 即 按照 假 音 推理 我 们 可 以 从 4 的 真实 性 及 甚 草 含 关 系 4 一 五 推 得 下 的 真实 性 。 例 如 ， 
4 等 于 “西红柿 是 红 的 ” 吾 等 于 “西红柿 是 熟 的 ” 如果“ 西红柿 是 红 的 ”成 光 ， 那 么 “ 西 
红 柿 是 熟 的 ”也 成 立 。 以 下 过 程 说 明了 这 个 概念 ; 

前 提 1 规则) 如 果 x* 是 4 ， 那 么 y 盐 吾 
前 提 2 事实) Y 十 内 








后 件 《结论 ) 是 号 


然而 ， 在 现实 生活 中 ， 我 们 获得 的 信息 往往 古 不 精确 、 不 完全 的 ; 或 者 事实 本 身 就 是 
模糊 而 不 完全 傅 定 的 ， 但 又 必须 利用 县 只 能 利用 这 些 信息 进行 判断 和 决策 ， 此 时 ， 人 们 的 
推理 直 以 近似 的 方式 利用 假 言 推理 。 

异 糊 逻辑 推理 是 一 种 近似 推理 ， 它 尾 从 一 组 模糊 “如 果 一 那么 ”规则 和 已 知事 实 中 得 
出 结论 的 推理 过 程 。 例 如 ， 假 定 有 相同 的 蕴含 规则 “如 果 西 红 柿 是 红 的 ， 那 么 它 是 熟 的 ” 
而 且 已 知 “ 西 红 柿 是 或 多 或 少 有 些 红 ”， 那么 可 以 推 得 “西红柿 蚌 或 多 或 少 有 些 蒜 ”。 这 
可 以 表示 为 : 

前 担 1《 规 则 ) 如 果 z 是 4 ， 那么 是 吾 
前 提 2《〈 事 实 ): 是 4 





后 件 〈 结 论 ): ?是 好 : 

其 中 ，4' 接近 于 4， 妃 ' 接近 于 吾 ， 当 4,， 互 , 4 和 下: 都 是 适当 论 域 的 模糊 集合 时 ， 前 
面 的 推理 过 程 被 称 为 近似 推理 或 模糊 推理 ， 也 称 为 广义 假 音 推理 ， 因 为 假 言 推 理 是 它 的 一 
个 特例 。 同 理 ， 当 存在 事实 “y 旦 B” ”时 ， 通 过 前 提 1 的 规则 ， 同 样 可 以 得 出 结论 “zx 
是 4””。 

定义 了 近似 推理 〈 模 烤 推 理 )。 

设 4 4 和 吾 分 别 是 怀 ， 工 和 了 的 模糊 集合 ， 模 糊 更 依 4 一 中 表示 为 忆 xX 了 7 上 的 模 
灶 关 系 尺 ， 则 由 “x 是 4”′” 利 模糊 规则 “如 果 关 是 4， 那 么 y 是 刀 ” 导 出 的 模糊 集合 殖 '， 





及 BO 们 = maxr mmintA fx) RCr 7] 


7.30 
=vxLAA(OD AHR(CC yj] 1 


或 等 价 地 ， 
忆 = AR= 4of4 -一 瑟 ) (7.21) 

晶 此 ， 只 要 给 模糊 蕴 合 4 一 瑟 定 义 好 恰当 的 模糊 关系 ， 就 可 以 采用 模糊 推理 的 步骤 
来 求 得 结论 了 。 

在 模 灶 还 辑 推 理 中 ， 模 糊 前 提 1 的 规则 “如 果 z 是 4， 那 么 是 吾 ” 表示 了 4 与 已 之 
间 的 模糊 获 含 关系 ， 记 为 4 一 百 。 对 于 模糊 绚 宫 关系 的 运算 方法 ， 很 多 人 进行 了 研究 ， 
党 用 的 有 以 下 两 种 方法 。 

耻 模 糊 列 念 最 小 运算 〈Mamdani ) 

及 三 迪 号 = 和 X 厂 = ACE) ABC 由 
瑟 XY 
四 模糊 草 含 积 运算 〈Larsen 


及 =4 一 下 = 4XR= 站 4CDRBCTAy) 
大 
模糊 推理 的 结论 是 通过 将 事实 与 规则 进行 合成 运算 后 得 到 。 实 际 应 用 中 广泛 使 用 的 合 
成 运算 方法 也 有 以 下 两 种 。 
1)》 最 大 一 最 小 合成 法 
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HPpB(OnD= v weDAaRec 人 
了 E 基 
2 ) 最 大 代数 积 合 成 法 
HB(DD= Y [aceoanco 从 
只 时 


其 中 ， 最 大 一 代数 积 人 台 成 法 常用 在 由 模糊 神经 网 络 构造 的 模糊 系统 中 。 在 异 崩 逻辑 推 
理 系统 中 ， 最 节 用 的 模糊 推理 方法 是 由 类 国 伦敦 大 学 的 玛 达 尼 《〈Mamdani ) 教授 首先 提出 
并 使 用 的 所 谓 最 小 一 最 大 人 台 成 法 。 它 号 一 种 以 模糊 关系 合成 法 则 为 基础 的 推理 方法 ， 它 可 
以 采用 连续 的 模糊 变 昌 ， 也 可 以 采用 离散 的 模糊 变量 。 模 糊 变 王 的 求 属 函数 曲线 可 以 是 比 
较 理 想 的 钟 形 申 线 ， 也 可 以 盐 便 于 使 用 而 相对 比较 简单 的 三 角形 。 昌 然 在 理论 上 钟 形 曲线 
比较 理想 ， 但 是 由 于 计算 量 大 ， 在 使 用 中 十 分 不 方便 ， 因 而 一 般 用 得 很 少 。 绝 大 多 数 都 采 
用 三 角形 。 

设 控制 系统 的 控制 规则 格式 为 : 

如 果 五 =4i 并 且 EC= 玉 ， 厚 各 习 = CN。 

其 中 7=1 2 .由 了 = 1 2 ...， 了 六 且 忆 是 体 辩 ，47 是 偏差 的 语言 变量 值 ， 红 
是 偏 关 变 化 率 ， 史 7 足 俩 养 变 化 率 的 语言 变量 值 ，C7 是 对 应 于 人 和 如 的 控制 量 的 诺言 变 
量 值 。 则 由 模糊 关系 兄 可 得 : 





恨 = 避 4X 有 xx 


其 中 了 = 1 2 mm = 1 2, .ma， 运 算 符 X 表示 对 模糊 量 求 直 积 ， 即 模糊 关系 的 隶属 函数 
为 : 


去 吕 ,= 开 
PRfa,B,c) 二 本 由 的 入 着 人 和 Rere) 














其 中 Yaeed,vpe, veeC, 上 且 4，B，C 分 别 是 偏 辩 、 偏 产 变化 率 、 控 制 量 的 论 域 。 


对 于 特定 的 输入 精确 量 ex 8# 则 有 输出 : 
LU=(4xB)oRR 








即 
及 CC) = 有 AQ 培 和 下 了 B 涪 和 下 RGBD,c) 


好 和 骨 由 二 旦 


最 后 再 用 质心 法 对 Z 求 精确 值 ， 即 可 得 到 最 终 的 控制 量 。 

这 种 处 理 方 法 的 最 大 优点 是 控制 规则 中 的 前 担 和 后 件 部 分 都 与 定性 的 语言 描述 对 
应 ， 而 且 如 上 所 示 ， 可 以 把 其 推理 过 程 用 图 形 方 式 直观 地 表示 出 来 ， 易 于 理解 。 但 是 用 这 
种 方法 ， 往 往 所 用 的 规则 数目 很 多 。 一 般 而 言 ， 如 果 规 则 的 条 件 部 分 的 变量 有 za 个 
如. .rm， 如 果 模 糊 标 记 取 7 个 ， 可 组 合 的 规则 数理 论 上 为 7 个 。 其 规则 数 是 以 宪 次 增 
加 的 。 当 然 在 实际 控制 系统 中 ， 并 不 是 所 有 的 规则 数 都 会 出 现 ， 有 不 少 组 合 态 是 不 会 出 现 
的 ， 因 而 实际 所 需要 的 规则 数 只 是 这 些 组 合 数 的 一 部 分 ， 甚 至 是 一 小 部 分 。 

下 面 将 首先 讨论 上 述 定义 中 模糊 推 惠 的 计算 问题 ， 然 后 进一步 讨论 在 描述 系统 行为 
时 具有 多 个 前 提 的 多 条 横 糊 规则 的 情况 。 鉴 于 最 大 一 最 小 合成 法 应 用 广泛 ， 且 易于 进行 图 
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形 解 释 ， 故 以 此 为 例 进 行 讨 论 。 
(1) 具有 单个 前 提 的 单一 规则 
这 是 最 简单 的 情况 ， 公 式 由 《〈7.20) 式 给 出 。 对 此 方程 的 进一步 简化 ， 有 
上 且 BO 二 VxLACa 和 Rs 妇 ] 
=vxzA4(JAA4CT) AAAB(C7 
=VxEUA4(J AAA 和 ARBtD) 
= 国 入 彤 有 划 


换言之 ， 首 先 求 出 上 (AAACnD 的 最 大 值 《 图 7.6 中 前 件 部 分 的 阴影 区 域 )， 然 后 ， 
结果 8 的 求 属 函 数 就 等 于 五 的 未 属 函 数 被 w 箱 位 后 所 得 的 图 形 ， 如 图 7.6 中 后 件 部 分 的 
阴影 区 域 。 直 观 上 ， 表示 一 条 规则 前 件 部 分 的 可 信 床 ， 这 个 测度 由 “如 果 一 那么 ” 规 


则 传递 ， 而 县 所 求 得 的 可 信 度 或 后 件 部 分 (图 7.6 中 下 ) 的 隶属 国 数 不 会 大 于 四 。 


(2》 具有 多 个 前 提 的 单一 规则 


具有 两 个 前 件 的 模糊 “如 果 一 那么 ”规则 通常 写作“ 如 晒 是 4 并 且 > 是 至 则 = 
是 7”， 例如 “如 果 庄 力 偏 高 并 且 还 在 继续 升 高 ， 那 么 停止 加 热 ”” 相应 的 广义 假 言 推 理 





的 问题 可 表示 为 : 








| 
图 7.6 利用 玛 达 尼 敬 售 及 最 大 一 其 小 读 合 成 的 广义 近世 推理 的 图 形 











解释 论 域 为 连续 时 具有 单个 前 提 及 单一 规则 的 推理 过 程 


前 提 1T 5 规则 ): 如 果 yY 是 4 and  y 了 是 下， 那么 z 是 安 
前 担 2《( 事 实 ): X 是 4 and ?了 是 如 





后 件 “结论 ): z 是 C 
前 提 1 中 的 模糊 才 则 可 以 写成 简单 的 形式 “4x 有 一 各” 
这 里 4 和 和 4” 、 忠 和 8 、C 和 C 分 别 是 不 同 论 域 X、7、Z 上 的 模糊 集合 。 
“如 果 z 是 4andy 是 吾 则 z 是 C” 的 数学 表达 式 赴 ， 


有 At 和 有 6 一 有 cz 
“是 4 andy 是 互 ” ”的 意义 是 : 
下 kandatt 切 二 有 4 入 有 ay 
若 用 玛 达 尼 推 理 方法 ， 用 其 殖 含 定 六 4- 总 = 上 入 吾 作 代 换 ， 就 变 成 


了 03 


ECOARESC Ac 
由 此 可 得 推理 结果 C” 为 : 
C=(4xB Jo(4x 刁 一 CC) 
其 隶属 函数 为 : 

RE =vao[s AH (OA[A (DAHs (Ac(z 
=VoiLLA (OA OA OA Ac 人 az) 
={vs[Au (DARA OOTAfvy Is (人 ARs OAAc(zj] 
= (的 入 多 有 入 有 cz) 


其 中 ，o4 和 四 8 分 别 是 4 门 4 和 五 门 号 隶属 函数 的 最 大 值 ， 通 常 @4 表 示 4 和 4' 之 
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间 的 匹配 度 : 05 类 似 。 由 于 模糊 规则 的 前 件 部 分 由 连接 词 “ 与 ”组 合 而 成 ， 因 此 常 称 
04 ^ 人 go 为 模 灶 规 则 的 激活 强度 ， 它 表示 规则 的 前 提 部 分 被 激活 的 程度 。 推 理 过 程 兄 赂 


7.7。 与 单 输入 情况 一 样 ， 求 出 4 对 4 、 召 对 B 的 隶属 度 m4 、oB8， 并 且 取 这 两 个 之 
中 小 的 一 个 位 作为 总 的 模糊 推理 前 提 的 隶属 度 ， 再 以 此 为 基准 去 切割 推理 结论 的 隶属 函 
数 ， 结 果 C”′” 的 隶属 函数 等 于 C 的 隶属 函数 被 激活 强度 mc (ac =@4 ^ap) 箱 位 后 的 结 
果 。 这 个 结论 可 以 直接 推广 到 多 于 两 个 前 提 的 情况 。 








图 ?.7 多 个 前 提 中 单一 规则 推理 过 程 的 图 形 解 释 
(3) 具有 多 个 前 提 的 多 条 规划 
两 输入 的 请 况 很 容易 就 可 推广 到 多 输入 的 情况 。 对 于 具有 多 个 前 提 的 多 条 规则 ， 通 党 
处 理 为 相应 于 每 条 模糊 规则 的 模糊 关系 的 并 集 。 因 此 ， 其 广义 假 言 推理 问题 可 以 写 为 ; 
前 提 1 (规则 ): 如 果 * 在 4，and  y 是 机 ， 那 么 z 是 所 
前 担 2 (规则 ): 如 果 z* 是 4，and  y 是 囊 ， 那 么 zx 是 C 
前 提 3 (事实 ): xx 是 4 and ?是 召 ; 





后 件 〈 结 论 ) : “2 昆 
我 们 可 以 按 梧 图 7.8 所 示 的 推理 过 程 来 求 得 输出 结果 模糊 集合 C′ 。 只 要 分 别 先 求 出 





各 个 输入 对 推理 前 提 中 相应 条 件 指 隶属 度 ， 青 取 其 中 最 小 的 一 个 作为 总 的 模糊 推理 前 件 的 
隶属 度 ， 去 切割 推理 结论 的 隶属 函数 ， 便 可 得 到 推理 的 结论 。 

为 了 验证 这 一 推理 过 程 ， 令 员 =4ix 再 一 C , 呈 =42Xx8B2 Ca 由 于 最 大 一 最 小 
算 子 “。” 是 对 并 算 子 “ 吕 ” 进 行 分 本 ， 则 有 





C=(4xB)o(R UR2) 
=[(4x5oR 休 UL(4x5oRR2] 
一 CiUC'> 





如 果 是 多 输入 又 是 多 推理 规则 的 情况 ， 又 如 何 进行 推理 昵 ? 以 两 输入 多 规则 情 为 
例 ， 若 有 条 规则 ， 其 一 般 形式 为 ， 





这 里 ，4 和 4 


图 7.8 多 个 前 提 中 允 条 规则 推理 过 程 的 图 形 解 
前 提 1 规则) 如果 x 是 4，and ?是 吕 ， 则 z 是 品 
前 提 2 (规则 ) 如 果 z 是 4，and y 是 可 ， 则 z 是 C 


四 


前 提 m= (规则 ): 如 果 x 是 4。and 是 妃 ， 则 z 是 C， 
前 提 ”+1《【 事 实 ): x 是 4 and yy 是 吾 ， 








后 件 “结论 ):  z 是 避 ' 


、 瑟 和 吾 ”、C 和 C” 分 别 是 不 同 论 域 X、Y、Z 上 的 模糊 集合 。 


“4 且 玉 ”的 意义 是 : 
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有 sandg( 熙 二 用语 (的 入 用 了 (7 
“如 果 上 4 有 卫 召 ， 那 么 王 ”的 数学 表达 是 : 
PA (ABC >ACI 2) 
若 用 玛 达 尼 维 理 方法 ， 用 其 理 售 定义 A 一 号 = 肯 入 作 代 换 ， 就 变 成 : 
LA (和 有 员 (O 和 ARC 


让 此 得 推理 结果 为 : 

C=(44NDB)ofi4 ANDBD) 一 Ci]U 
={44NDB)of[44ND5D 一 Ci 
ULCAANDB)o[(A 4NDB )-C,]] 
=CIUC2U…UC， 

其 中 : 
Ci =(4 ANDB)of[(4 ANDB)-C] Ce12 
=[4s( 本 一 CDmnEBo(B CD 
其 隶属 函数 为 : 


Pe (2=Xas OOAIA DOAAc(ImXUs CODALa (DARc CD) 
=XYa CDAAGIAHcGCDOfYiaas (ARAs(ODAEc(z) 
一 (OA 入 有 ca 站 (OOs 和 He (ab 
二 (OO ADOp)AAectz) 
如 果 有 两 条 两 输入 的 规则 ， 那 么 得 到 两 个 结论 : 
RCI( 本 二 负 丰 入 四 电信 C 


EC 7 (7= 负 4 人 的 及 信人 DC 





其 意义 为 分 别 从 不 同 的 规则 得 到 不 同 的 结论 ， 有 几何 意义 是 分 别 在 不 同 规则 中 用 各 自 推理 前 
提 的 总 隶属 度 去 切割 本 推理 规则 中 结论 的 东 属 函数 ， 以 得 到 输出 结果 。 再 对 这 所 有 的 结论 


求 模糊 逻辑 和 ， 即 进行 “并 ”运算 ， 便 得 到 总 的 推理 结论 。 
C=CUC> U…UC， 


这 种 推理 方法 是 先 在 推理 前 担 中 选取 各 个 条 件 中 隶属 度 最 小 值 ( 即 “最 不 适 本 ”的 丸 
属 度 》 作 为 这 条 规则 的 适 配 程度 ， 以 得 到 这 条 规则 的 结论 ， 这 称 为 取 小 min 操作 :， 再 
对 各 规则 的 结论 综合 ， 选 取 其 中 适 配 度 最 大 前 部 分 ， 即 取 大 (max) 操作 。 整 个 并 集 的 面 
积 部 分 就 是 总 的 推理 结论 。 这 种 推理 方法 简单 ， 得 到 广泛 应 用 。 但 是 它 也 有 -- 个 缺点 ， 那 
就 是 其 推理 结果 经 常 不 够 平滑 。 由 此 ， 有 人 主张 把 从 推理 前 提 到 结论 肖 顶 法 的 “与 ”运算 
改 成 “乘积 ”运算 ， 这 就 不 是 用 推理 前 提 的 隶属 度 为 基准 去 切割 推理 结论 的 隶属 函数 ， 而 
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是 用 该 隶属 度 去 乘 结论 的 隶 遍 函数， 这样 得 到 的 结论 就 不 是 呈 平 台 梯 形 ， 而 是 原 悄 户 函 数 
的 等 底 缩小 。 这 种 处 理 结果 经 过 对 各 个 规则 结论 “并 ”运算 后 ， 总 推理 结果 的 平滑 性 得 到 
改善 。 


在 实际 应 用 中 ， 常 常 采 用 输入 量 的 模糊 集合 为 模 灶 单 值 〈singleton )， 即 4= 一 ， 
心 


Bi 一， 则 有 : 
30 


Ac(z= 局 册 A 人 ci (2) 


其 中 
Oi =H4 CO) ABR (0 

这 里 ，m, 可 以 被 看 成 是 相应 于 第 工 条 规则 的 加 权 因 子 ， 也 可 以 被 看 成 是 第 工 条 规则 的 适用 
程 产 或 其 对 模糊 作用 所 产生 的 贡献 大 小 。 下 而 给 出 了 一 个 采用 离散 的 单 值 进行 模糊 推理 的 
简单 实例 。 

例 7.3 采用 模糊 逻辑 推理 的 方法 ， 根 据 室 外 温度 以 及 草地 干 湿 状况 ， 对 室外 草地 进行 
自动 喷 水 控制 重 的 具体 求解 。 

首先 确定 输入 /输出 论 域 及 其 隶属 函数 。 这 古 一 个 自动 喷灌 系统 的 设计 问题 。 系 统 的 输 
入 变量 为 温度 和 温度; 控制 量 是 赔 水 量 的 大 小 。 





20 3032 ”40TToO 1011 旭 30 久 
(aj 输入 变量 一 一 空气 温度 的 隶属 函数 人 b) 输入 变量 一 一 土壤 汪 度 的 隶属 函数 








70 时 间 { 分 》 
te) 输出 变量 一 浇 水 时 间 的 隶 妃 函数 
图 7.9 
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我 们 定义 空气 温度 的 论 域 为 0OC 到 40C 。 这 里 之 所 以 把 下 限定 为 0C ， 是 因为 喷灌 系 
统 在 水 冻结 冰 时 是 不 能 工作 的 。 振 此 ， 我 们 主观 地 把 空气 温度 模糊 变量 的 论 域 定 尺 为 : 
空气 温度 : [0，40]， 模 糊 标 记 为 : 冷 、 温 、 热 。 
与 此 类 似 ， 对 土壤 湿度 的 论 域 定 尽 为 
土壤 温度; [0 多 ，30]， 模 糊 标 记 为 : 干 、 适 中 、 湿 。 
它们 的 录 属 通 数 如 图 7.9 所 示 。 
1 ) 设 控制 规则 为 





对 于 任意 输入 变量 ， 如 : 温度 =32C， 湿 度 = 11 色 。 


这 里 ， 对 输入 变量 采用 单 值 模糊 化 ， 由 此 在 各 自 隶 属 函数 图 〔 见 图 7.9(a] 和 (b)) 上 共 
可 得 如 下 四 条 掠 制 规则 : 

叫 “ 如 果 温 度 是 热 〈0.46)》 且 士 壤 是 干 〔0.257?， 那 么 加 水 时 间 为 长 六 

念 “ 如 果 温 度 是 温 〔〈0.2) 且 土 壤 是 适中 〈0.75)， 那 么 加 水 时 间 为 中 等 所 

轩 “如果 温度 是 温 〈0.2) 且 土 壤 是 干 《0.2$)?， 那 么 加 水 时 间 为 长 所 

二 “如 果 源 度 是 热 〈0.46) 且 土 壤 是 适中 《〈0.757， 那 么 加 水 时 间 为 中 等 六 

实际 上 , 因为 各 模糊 标记 之 间 的 隶属 函数 相交 不 超过 两 个 , 所 以 无 论 模糊 标记 取 多 少 ， 
对 于 任意 得 入 温度 和 疆 度 ， 都 只 与 两 个 模糊 标记 相关 ， 所 以 都 只 有 四 条 控制 规则 被 激活 。 





2 }) 控制 规则 的 强度 


一 旦 确定 了 等 一 前 扣 的 相关 隶属 度 的 值 ， 则 要 俩 定 每 一 控制 规则 的 强度 。 既 然 前 提 是 


由 “ 且 ” 即 “与 ”也 就 是 “and” 来 联接 的 ， 所 以 规则 强度 的 选择 是 以 前 提 中 的 最 小 强度 
值 为 该 规则 的 真 值 。 对 于 前 面 四 条 规则 ， 各 自 的 规则 强度 分 别 为 : 
人 min(0.46.0.25) = 0.25; 


国 min(0.2.0.7S) = 0.2; 
包 min(0.2.0.25) = 0.2; 
四 minf0.46.0.75) = 0.46。 
3) 祖 据 规则 强度 来 确定 模糊 奏 出 


由 横 糊 规则 控制 表 以 及 名 中 所 确定 的 规则 强度 值 可 获得 控制 量 的 隶属 度 ， 即 : 
“如 果 渴 度 是 热 〈0.46) 且 土 壤 是 干 《0.25)7， 那 么 加 水 时 间 为 长 〈0.257)9 
“如 果 温 度 是 温 《0.2》 且 士 壤 是 适中 〔〈0.7$?， 那 么 加 水 时 间 为 中 等 《0.2)?， 
“如 果 温 度 是 温 (0.2) 且 土 壤 是 二 【0.25)， 那 么 加 水 时 间 为 长 〈0.272” 
“如 果 温 度 是 热 〈0.46) 皇 土壤 是 适中 〈0.75) ,那么 萎 水 时 间 为 中 等 〈0.46) 

由 此 得 出 输出 控制 量 在 确定 输入 温度 和 湿度 下 的 模糊 控制 变量 的 隶属 度 。 并 且 从 中 可 


以 看 到 ， 在 不 同 输入 前 提 条 件 下 ， 得 到 相间 的 控制 行为 《如 控制 规则 心 和 全 具有 相同 的 控 
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制 规 则 为 “ 却 水 时 间 为 长 ”的 控制 ， 控 制 规则 @@ 和 亿 具 有 相同 的 控制 规则 为 “加 水 时 间 为 
中 等 ” 的 控制 )。 在 这 种 情况 下 ， 模 糊 控 制 的 输出 为 具有 相同 输出 行为 的 所 有 规则 中 规则 
强度 最 大 的 那个 。 在 本 例 中 ， 训 得 输出 控制 模糊 量 为 加 水 时 间 为 长 (0.25》 和 中 等 《0.46)。 
换 和 名 话说 ， 有 两 个 或 两 个 以 上 的 相同 深 制 企图 影响 输出 时 ， 规 则 强度 为 最 大 的 那个 值 起 主 
导 作 用 。 最 后 控制 输出 量 为 
025*70+046*35_175+16.1 4732 
0.25+0.46 071 

道 过 以 上 过 程 ， 可 以 得 出 一 个 模糊 推理 系统 的 求解 步骤 为 

四 建立 控制 规则 ; 

名 确定 前 吉 的 真 值 ， 对 于 每 一 精确 输入 值 ， 通 过 使 用 隶属 函数 进行 模糊 化 处 再， 以 获 
得 每 一 前 提 的 真 值 《 隶 属 度 )， 

久 求 出 每 一 控制 规则 的 强度 : 它 等 于 每 一 规则 中 最 小 的 前 提 丸 属 度 ， 

全 确定 每 一 结论 标记 模 类 和 输出， 它 等 于 相同 结论 标记 中 的 最 大 规则 强度 ; 

全 求 模糊 输出 控制 量 。 

以 上 计算 出 的 只 是 在 一 组 输入 下 的 输出 ， 从 中 可 以 看 出 其 计算 的 复杂 性 。 这 也 正 是 简 
单 的 模糊 逻辑 控制 往往 是 事先 做 好 控制 律 的 表格 存储 到 计算 机 中 的 康 因 ， 当 然 ， 由 于 内 存 
有 限 ， 必 然 导 致 控制 精度 不 高 的 情况 出 现 。 要 想 提 高 模糊 逻辑 控 省 的 效率 和 棕 制 精度 ， 有 
效 的 办 法 昆 引 入 神经 网 络 的 自 适 应 功能 。 这 将 在 后 面 的 章节 中 进行 详细 讨论 。 
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第 8 章 模糊 控制 器 的 设计 方法 


无 论 是 采用 自动 控制 原理 ， 还 是 现代 控制 理论 米 设计 一 个 自动 控制 系统 ， 都 需要 事先 
建立 被 控 对 象 的 煞 学 异型 ， 需 要 知道 模型 的 结构 、 阶 次 和 参数 等 方面 的 情况 ， 在 此 基础 上 
合理 地 和 逃 择 控制 策略 ， 进 行 控制 器 的 设计 。 但 丰 在 实际 系统 的 控制 中 ， 册 于 被 控 对 象 的 复 
杂 人 性, 很 难 建立 起 精确 的 数学 模型 ， 这 时 ， 采 用 经 典 控制 理论 就 无 法 得 到 满意 的 控制 效果 ， 
甚至 无 法 对 系统 进行 控制 。 

在 很 多 类 似 于 以 上 的 现实 控制 系统 中 ， 采 用 模 精 逻 和 拧 制 常常 能 够 达到 自 好 的 控制 效 
果 。 模 糊 控 制 的 基本 忠 想 就 是 利用 计算 机 米 实 现 人 的 控制 经 验 ， 而 人 的 控制 经 验 一 般 是 由 
语言 来 表达 的 ， 语 言 控 制 规则 通常 用 “如 果 4， 那 么 下 ”的 方式 来 表达 在 实际 控制 中 的 专 
家 经 验 和 知识 ， 所 以 模糊 控制 规则 往往 兵 有 相当 的 模糊 性 ， 其 最 大 特征 是 将 专家 的 控制 经 
验 、 知 识 表 示 成 语言 控制 规则 ， 然 后 用 这 些 规则 去 入 制 系统 。 因 此 ， 模 糊 控制 特别 适用 于 
模 氢 专家 对 数学 模型 未 知 的 、 复 杂 的 、 非 线性 系统 的 控制 。 这 些 控 制 规则 是 模糊 条 件 语言 
的 形式 ， 可 以 用 模糊 数学 的 方式 来 描述 过 程 变量 和 控制 作用 等 模糊 概念 及 它们 之 间 的 关 
系 ， 然 后 又 可 以 由 这 些 关 系 某 时 刻 的 过 程 变量 值 采用 模糊 推理 的 方法 求 出 此 时 刻 的 控制 


里 。 





8.1 精确 与 模糊 控制 的 事例 


为 了 更 好 地 说 明 模 糊 逻 辑 控 制 ， 首 先 用 线性 和 模糊 这 两 种 不 同 的 方法 来 解决 同一 个 问 
题 。 在 此 所 选 掺 的 是 一 个 比较 能 够 说 明 问题 的 小 费 问 题 。 在 国外 餐馆 吃饭 ， 一 般 都 要 给 侍 
者 付 服 务 小 费 ， 基 本 的 付 小 费 问 题 可 以 这 样 叙 述 : 用 0 到 10 表示 餐馆 的 服务 质量 〈 其 中 
10 表示 最 好 )， 那 么 小 费 应 当 如 何 付 ? 此 处 需 说 明 的 是 ， 在 国外 ， 尤 其 在 美国 ， 在 餐馆 中 
就 餐 的 平均 小 费 应 当 占 餐 费 的 15 多 。 当 然 ， 实 际 付 小 费 的 多 少 是 根据 服务 质量 而 有 所 变 
化 的 。 下 面 我 们 分 别 以 不同 的 方式 米 看 看 付 小 费 的 情况 。 





8.1.1 采 用 精确 的 非 模 寡 求解 方法 


最 简单 的 付 小 费 的 关系 式 可 以 是 按 账 单 费 用 的 15 多米 休 给 。 如 果 我 们 将 账单 数 定义 
为 1， 那 么 小 费 金 额 则 为 ， 
小 费 = 0.15 
服务 质量 与 付费 之 间 的 关系 式 可 以 用 图 形 表 示 为 如 图 8.1 所 示 。 
很 显然 ， 这 种 藉 系 式 着 没有 真正 考虑 服务 的 质量 ， 给 人 感觉 有 些 不 合理 ， 应 当 根 据 服 
务 质量 的 好 坏 来 变化 给 小 费 的 数量 。 在 同时 考虑 半 均 小 费 为 15 锡 的 情况 下 ， 我 们 不 妨 只 
给 最 次 的 服务 5 名 的 小 费 ， 而 随 着 服 劳 质量 的 增加 而 线性 地 从 0 增加 到 10， 以 使 最 差 的 服 
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务 小 费 为 5 多， 最 好 的 小 费 为 2$ 锡 ， 其 数学 关系 式 可 以 写 为 : 
小 费 =0.20110* 服务 质量 +0.05 
此 时 的 小 费 与 服务 的 关系 图 如 图 8. 2 所 示 。 
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图 8. 1 服务 质量 与 付费 之 问 的 关系 网 
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图 8.2 小 竟 与 服务 的 关系 图 

砚 在 看 来 似乎 侣 我 们 的 意 。 其 小 费 的 付 法 和 服务 质量 扯 上 了 钧 ， 而 且 殷 直观 。 更 深层 
次 地 我 们 会 想到 ， 我 们 的 满意 度 不 仅 取 决 于 服务 质量 ， 同 时 与 餐厅 所 供 食物 的 质量 也 是 密 
不 可 分 的 。 因 为 如 果 食 物质 量 很 差 ， 服 务 质 量 再 好 我 们 也 不 会 满意 。 所 以 ， 更 合理 的 是 应 
当 同 时 考虑 服务 与 食品 两 个 方面 的 质量 。 由 此 将 付 小 费 的 美 系 式 从 仅 取 决 于 服务 质量 的 一 
维 变量 ， 扩 展 到 同时 考虑 服务 以 及 食品 质量 的 二 维 关 系 式 。 同 样 我 们 定义 食品 质量 的 等 级 
也 是 从 0 到 10 (其 中 10 表示 楼 好 )。 沿 用 上 面 的 图 8 .2 表示 的 变化 的 关系 式 ， 我 们 可 以 
写 出 新 的 付 小 费 的 关系 式 为 ; 


小 费 =0.20/20*# (服务 质量 + 食 牺 质量) + 0.05 


其 关系 图 如 图 8. 3 所 示 。 
很 好 ， 这 是 一 种 做 法 。 不 过 仔细 想 想 ， 虽 然 付 小 费 应 当 同 时 考虑 服务 与 食品 这 两 个 因 
素 ， 不 过 似乎 服务 质量 的 因素 更 为 重要 ， 小 费 主 要 付 的 是 服务 质量 费 。 这 样 想 来 ， 在 这 两 
个 困 素 中 ， 应 将 服务 质量 在 小 费 中 占 较 大 的 比重 。 如 让 服务 质量 在 玖 个 小 费 中 十 80 名 ， 
而 食品 质量 只 在 小 费 中 上 2 和， 所 以 可 以 重新 写 出 如 下 算式 : 
服务 比率 =0.8; 
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小 费 = 服务 比率 *〈0.20/10* 服 务 质 量 +0.05) +【〔1- 服 务 比 率 ) *《0.20/10*+ 食 品质 量 +0.05) 
其 关系 图 如 图 8.4 所 示 。 





图 8.5 小 费 与 服务 质量 及 其 食物 质量 的 关系 图 
从 末 体 上 看 ， 其 小 费 的 付出 似乎 又 太 线 性 增长 了 ， 总 感觉 在 中 间 一 段 应 当 平缓 一 些 ， 
即 项 望 在 一 般 的 情况 还 是 付 常规 的 15 旬 ， 只 是 在 服务 太 糟 或 服务 根 好 时 在 付费 上 有 所 差 
别 ， 以 表示 自己 的 满意 度 。 我 们 仍然 可 以 用 线性 关系 来 达到 此 日 的 ， 但 要 用 几 个 条 件 语 色 : 
如 果 0< 服务 质量 < 3， 小 费 = (0.10/3) * 服务 质量 0.05; 
1 之 
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如 果 3 < 服务 质量 < 7 小费 =0.15; 

如 果 ? 所 服务 质量 < 10， 小 费 = 〈0.103) *〈 服 务 质 量 -7) +0.15。 

而 对 食物 质量 的 关系 式 不 做 任何 变动 。 这 需要 再 在 上 面 的 条 件 名 中 加 上 以 前 的 食 牺 关 
系 式 ， 由 此 可 得 到 付 小 费 的 最 终 基 系 图 如 图 8 .5 所 示 。 

现在 的 图 形 看 起 来 十 分 令 人 满意 。 不 过 回 过 头 来 想 一 想 ， 从 最 初 的 想法 ， 经 过 一次 改 
进 ， 最 后 的 小 费 计 算 公 式 己 变 得 相当 复杂 。 如 果 想 进一步 改进 ， 算 式 还 将 变 得 更 复杂 。 丽 
且 对 于 不 是 从 最 新 设计 思想 过 来 的 人 很 难 看 清 其 算法 是 如 们 工作 的 。 下 面 我 们 再 水 看 看 用 
模糊 方法 是 刀 何 解决 问题 的 。 





8. 1.2 模糊 方法 


如 果 只 需要 抓 住 问题 的 实质 训 可 以 解决 问题 ， 那 是 最 好 不 过 的 了 。 对 于 前 面 的 小 费 问 
题 ， 我 们 烈 出 问题 的 实质 性 内 容 ， 可 以 归纳 为 : 

包 如 果 服 务 质量 不 好 ， 那 么 小 费 低 ; 

包 如 果 服 务 质量 好 ， 那 么 小 费 中 ; 

怨 如 果 服 务 质量 摄 好， 那么 小 费 高 。 

上 述 规 贴 的 表达 顺序 可 以 赴任 意 的 ， 哪 一 条 在 前 在 后 是 天 关 紧要 的 。 如 果 我 们 想 把 食 
物 的 质量 因素 也 包括 在 内 ， 可 以 另 加 下 列 两 条 规则 : 

多 如果 食物 质量 差 ， 那 么 小 费 低 ; 

名 如 果 食 物 吉 口 ， 那 么 小 费 高 。 

实际 上 ， 我 们 可 以 将 两 种 不 同 的 现 则 合并 成 三 条 规则 : 

名 如 果 服 务 质量 不 好 或 者 食物 质量 送 ， 那 么 小 费 低 ; 

鸭 如 果 有 最 务 质量 好 ， 那 么 小 费 为 中 : 

地 如 果 服 务 质量 极 好 或 者 食物 可 口 ， 邦 么 小 费 高 。 

这 三 条 规则 就 是 我 们 解 题 的 核心 。 这 些 规则 正好 构成 了 模糊 逻辑 系统 的 规则 。 疝 时 采 
用 模糊 逻辑 推理 还 具有 其 他 特点 ， 如 很 容易 增加 规则 而 不 影响 已 有 的 规则 以 及 模糊 规则 县 
有 普 衣 的 适应 性 等 。 现 在 只 要 我 们 给 语言 变量 赋予 数学 定义 【比如 小 费 “ 中 ” 直 多 少 )， 
就 可 以 得 到 一 个 完整 的 模糊 锥 理 系统 。 当 然 ， 这 里 面 还 涉及 到 模糊 推理 方法 。 比 如 ， 现 有 
的 规则 如 何 合并 ， 如 何 定义 语言 变量 等 ， 这 些 都 是 模糊 逐 煤 推理 的 网 节 。 不 过 这 些 具 体 的 
方法 是 具有 通用 性 的 ， 它 们 不 会 因 问 题 的 改变 而 有 很 大 的 变化 。 模 糊 逮 和 辑 推理 的 通用 性 使 
模糊 逻辑 应 用 起 来 十 分 地 方便 ， 司 时 它 还 具有 自 适 应 性 、 简 单 和 易于 应 用 等 特点 。 

这 里 我 们 给 出 在 上 述 三 条 规则 下 的 模糊 逻 往 系统 给 出 的 有 关 小 费 问 题 的 答案 ,如 图 8.6 
所 示 。 有 从 中 可 以 看 出 ， 如 果 采 用 线性 分 段 来 表示 将 是 很 复杂 的 ， 但 用 模糊 到 辑 捧 理 三 条 规 
册 足 侨 ， 而 且 相 当 准 确 地 表达 了 人 的 意愿 。 

为 了 更 好 地 认识 和 掌握 模糊 逻辑 推理 系统 ， 下 面 我们 从 模糊 逻辑 控制 过 程 入 于。 
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图 8.6 小 费 问 题 的 输入 输出 关系 网 


8.2 模糊 遥 辑 控制 过 程 


一 般 而 言 ， 模 类 控制 是 建立 在 人 的 经 验 和 常识 的 基础 上 ， 这 就 是 说 ， 操 作 人 员 对 被 控 
系统 的 了 解 不 是 通过 精确 的 数学 表达 式 ， 而 是 示 过 操作 人 员 丰 富 的 实践 经 验 和 常识 。 由 于 
人 的 决策 过 程 本 质 上 融 有 具有 模 炎 性 ， 因 此 ， 控 制 动 作 并 非 稳定 一 致 ， 且 有 一 定 的 主观 性 。 
但 是 ， 有 经 验 的 模糊 控制 设计 工程 师 可 以 通过 对 操作 人 员 控 制 动 作 的 观察 和 与 操作 人 员 的 
交谈 讨论 ， 用 语言 把 操作 人 员 的 控制 策略 描述 出 米 ， 以 构成 一 组 用 语言 表达 的 定性 的 决策 
规则 。 如 采 把 那些 热 练 技术 工人 或 者 技术 人 员 的 实践 经 验 进 行 总 结 和 形式 化 描述 ， 用 语言 
表达 成 一 组 定性 的 条 件 语 句 和 精确 的 决策 规则 ， 然 后 利用 模糊 集合 作为 工具 使 其 定量 化 ， 
设计 一 个 控制 器 ， 用 形式 化 的 人 的 经 验 法 则 模仿 人 的 控制 策略 ， 再 驱动 设备 对 复杂 的 过 程 
进行 控制 ， 形 成 模糊 控制 器 。 

山 一 种 模糊 规则 构成 的 模糊 系统 可 代表 一 个 输入 、 输 出 的 映射 关系 。 从 理论 上 说 ， 模 
类 系 统 可 以 遏 近 任意 的 连续 函数 。 要 表示 从 输入 到 输出 的 函数 关系 ， 模 糊 东 统 除 了 模糊 规 
则 外 ， 还 必须 有 模糊 多 辑 推理 和 解 模糊 的 部 分 。 模 糊 逻 辑 推理 就 是 根据 模糊 关系 合成 的 方 
法 ， 从 数 条 同时 起 作用 的 模糊 规则 中 ， 按 并 行 处 理 方式 产生 对 应 输入 量 的 输出 模 籽 子 集 ， 
解 模糊 过 程 则 是 将 输出 模糊 子 集 转化 为 非 模糊 的 数字 量 。 图 8.7 给 出 了 一 般 模 糊 推 理 系统 


- 的 方 框图 。 





图 8. 7 模糊 推理 控制 器 的 方 框图 
模糊 控制 系统 的 核心 是 模糊 逻辑 控制 器 ， 模 糊 逻 租 控 制 器 一 般 是 可 以 舍 软 件 编程 来 实 
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现 的 。 实 现 模糊 逻辑 控制 的 一 般 步 骤 如 下 : 

第 一 步 ， 通 过 传感器 把 要 监测 的 物理 量变 成 电量 ， 再 通过 模 数 转换 器 把 它 转 换 成 精确 
的 数字 量 ， 精 确 数字 量 输入 经 过 模糊 逻辑 控制 器 ， 首 先 把 这 个 精确 的 输入 量 转 换 成 模糊 集 
合 的 隶属 函数 ， 这 一 步 就 是 精确 量 的 模糊 化 ; 

然后 ， 根 据 有 经 验 的 操作 者 或 者 专家 的 经 验 制定 出 模 戎 控制 规则 ， 并 进行 模糊 膛 辑 推 
理 ， 以 便 得 到 一 个 模糊 输出 集合 ， 部 一 个 新 的 模糊 隶属 函数 ， 这 一 步 为 模糊 控制 规则 形成 
和 推理 ， 其 日 的 是 利用 模糊 输入 值 获取 适当 的 控制 规则 ， 为 每 个 控制 规则 确定 适当 的 隶属 
度 ， 并 且 通 过 加 权 计 算 合 并 那些 规则 的 输出 。 

最 后 ， 根 据 模糊 逻辑 推理 得 到 的 输出 异 糊 隶属 函数 ， 用 不 同 的 方法 找 一 个 县 有 代表 性 
的 精确 值 作为 控制 量 ， 这 一 步 成 为 模糊 输出 量 的 解 模糊 判决 ， 其 日 的 是 把 分 布 范围 概括 合 
并 成 单 点 的 输出 值 ， 加 到 执行 器 上 实现 控制 。 一 般 模 糊 控制 系统 的 方 框图 如 图 8.8 所 示 。 








图 8.8 模糊 控制 系统 的 方 框图 

在 模糊 控制 系统 设计 中 ， 怎 样 设计 和 调整 模糊 控制 器 及 其 参数 是 一 项 很 重要 的 工作 。 
根据 以 上 对 模糊 逻辑 控制 过 程 以 及 模糊 控制 系统 的 描述 可 知 ， 设 计 模糊 控制 器 主要 包括 以 
下 几 项 内 容 ; 

@ 确 定 模糊 控制 器 的 输入 变量 、 输 出 变量 和 论 域 ; 

@ 确 定 模糊 化 和 解 模糊 化 方法 ; 

@@ 确 定 模 灶 控 制 器 的 控制 规则 及 其 模糊 推理 方法 ， 

图 量化 因子 及 比例 因子 的 选择 ; 

加 编制 模糊 算法 的 应 用 程序 ; 

加 系统 的 仿真 实验 及 参数 的 确定 。 


8.3 输入 变量 和 和 输出 变量 的 确定 


模糊 控制 器 的 结构 设计 就 是 要 确定 模糊 控制 器 的 输入 变量 和 和 输出 变量 。 究 竟 选 择 何 种 
信息 作为 模 戎 控制 系统 变量 ， 必 须 深 入 研究 手动 控制 过 程 中 有 经 验 的 操作 人 员 主 要 根据 哪 
些 信息 控制 被 擦 对 象 向 预期 目标 逐 近 。 

人 在 进行 手动 控制 过 程 中 ， 操 作者 期 望 实现 控制 目标 ， 一 旦 偏离 目标 ， 出 班 了 偏差 ， 
操作 者 僵 根 据 偏 差 大 小 进行 调整 。 人 的 大 脑 中 误差 的 “大 ”和 “小 ”， 这 些 概念 是 模糊 的 。 
在 整个 手动 控制 过 程 中 ， 人 所 能 获得 的 信息 一 般 可 以 概括 为 三 个 : 误差 、 误 装 的 变化 和 误 
莽 变 化 的 速率 。 在 手动 控制 过 程 中 ， 人 对 误差 、 误 差 的 变化 以 及 误差 变化 的 速率 这 三 种 信 
息 的 敏感 程度 是 完全 不 同 的。 由 于 模糊 控制 器 的 控制 规则 往往 是 根据 手动 控制 的 大 量 实践 
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经 验 总 结 出 米 的 ， 因 此 ， 模 糊 控制 器 的 输入 变量 自然 也 可 以 有 三 个 : 误 关 、 误 差 的 变化 和 
误差 变化 的 速率 ;而 输出 变量 一 般 选 拌 为 控制 垦 或 控制 量 的 变化 ， 即 增 量 。 

通常 将 模糊 控制 器 输入 变量 个 数 称 为 模糊 控制 的 维 数 。 常 见 的 模 类 控 制 器 的 结构 有 三 
种 形式 ， 如 图 8.9 所 示 。 从 理论 上 讲 ， 模 靖 控 制 器 的 维 数 越 高 ， 控 制 效果 也 越 好 ， 但 是 维 
数 高 的 模糊 控制 器 实现 起 来 相对 于 维 数 低 的 要 复杂 和 困难 得 多 。 人 们 经 常 使 用 的 是 一 维 模 
灶 控 制 器 。 在 本 书 不 加 说 明 的 控制 器 设计 中 ， 部 是 以 误差 和 误差 的 变化 作为 控制 器 输入 变 


量 的 。 
百 已 三 如 
模 灶 控 制 器 模糊 控制 器 
二 











模糊 控制 器 | 避 


几 8.9 常用 的 模糊 输入 变 基 ， 其 中 有 为 误 答 


8.4 论 域 的 确定 


模糊 控制 器 的 输入 信号 〈 误 差 、 误 差 变 化 率 ) 的 实际 范围 称 为 这 些 变 民 的 论 域 ， 为 了 
确定 论 域 ， 首 先 应 该 确定 整个 设计 系统 相 联 系 的 变量 所 应 用 的 范围 。 这 个 选择 范围 应 该 是 
经 过 细心 地 推 殴 过 的 。 例 如 如 果 指 定 的 范围 太 小 ， 孝 么 正常 的 数据 就 可 能 会 出 现在 所 定义 
的 论 域 之 外 ， 由 此 所 得 系统 的 性 能 就 可 能 受到 影响 。 反 之 ， 如 果 定 义 的 基本 论 域 本 大 ， 就 
会 对 某 些 数值 响应 迟钝 。 这 对 某 些 具有 饱和 现象 的 系统 没有 问题 ， 但 是 在 其 他 系统 中 就 会 
出 现 问 题 。 同 样 ， 每 个 输出 变量 的 论 域 范围 也 应 该 仔细 地 推荐 过 。 一 般 而 上 彰 ， 如 果 论 域 被 
定义 得 太 大 也 会 出 现 问题 。 在 这 种 情况 下 ， 控 制 器 工作 过 程 中 的 不 被 使 用 区 域 就 比较 大 。 
这 个 问题 在 解 模 糊 时 就 会 更 加 明显 ， 因 为 这 要 不 均匀 面积 很 大 的 来 属 函数 就 会 使 它 在 质心 
法 中 产生 较 大 的 偏 移 ， 使 其 他 与 其 交叉 的 隶属 函数 的 影响 不 适当 地 减 小 。 

论 域 离散 化 经 常 被 称 为 苦 化 。 实际 上 , 量化 是 将 一 个 论 域 离散 成 确定 数目 的 几 小 段 ( 重 
化 集 ) ， 每 一 段 用 某 一 个 特定 术语 作为 模糊 标记 ， 这 样 就 形成 一 个 离散 比例 。 然 后 通过 对 
这 新 的 离散 域 中 每 个 特定 术语 车 予 隶 属 度 来 定义 模糊 集 。 为 减少 控制 器 运行 时 间 ， 可 用 离 
线 处 理 方式 先 完成 建立 在 离散 化 上 的 控制 查询 玫 ， 用 该 表 定 义 对 所 有 可 能 的 输入 信和 号 进行 
合并 的 控制 器 输出 。 在 模糊 到 辑 控制 是 连续 的 情况 下 ， 量 化 等 级 的 数目 应 该 足够 大 ， 以 便 
有 充分 的 近似 度 ， 但 另 一 方面 ， 又 要 尽量 减少 该 等 级 数 以 减少 复杂 人 性 和 存储 量 。 量 化 等 级 
的 选择 对 控制 效果 具有 关键 性 的 作用 。 为 实现 离散 化 ， 就 需要 做 标记 映 射 ， 把 测量 变量 转 
换 成 离散 论 域 中 的 量 值 ， 这 种 映射 可 用 区 间 均 匀 【 线 人 性》 关系 ， 也 可 用 非 均匀 【〈 非 线性 ) 
关系 ， 或 者 两 者 兼 而 有 之 。 量 化 等 级 的 选择 与 某 些 先 验 知识 有 关 。 例 如 用 和 粗糙 的 解决 方法 
其 误差 就 大 ， 而 用 清晰 的 解 次 方法 其 误差 就 小 。 一 般 而 言 ， 由 于 离散 化 ， 将 影响 模糊 控 制 
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器 的 性 能 ， 并 对 过 程 状态 变量 值 的 小 偏差 将 更 不 灵敏 。 

为 实现 模糊 控制 器 的 标准 化 设计 ， 纤 前 在 实际 中 常用 的 处 理 方法 是 把 误差 的 变化 范围 
设 定 为 [-6,+6] 区 间 连 续 变 化 量 (或 根据 所 选取 的 模 灶 标 记 数 来 确定 论 域 的 范围 ) ， 使 之 离 
散 化 ， 以 论 域 范围 取 [6,+6] 为 例 ， 构 成 含有 13 个 整数 元 素 的 离散 集合 : 

{-6，-$，-4，-3，-2，-1，0，1，2，3，4，5， 

实际 上 如 果 是 非 对 称 型 的 ， 也 可 用 1 一 13 取代 -6 一 46。 

如 上 所 述 ， 实 际 系统 工 作 的 精确 输入 量 的 变化 范 国 一 般 不 会 是 在 [-6,+6] 之 岂 ， 如 果 其 
基本 论 域 是 在 [ e, 王 ] 之 间 的 话 ， 可 以 通过 变换 : 


= 三 2 [| {8.1 ?> 





一 2 
将 在 [wa 有 ] 之 间 变 化 的 变量 转化 为 [6,+6] 之 间 变 化 的 变量 y。 
模糊 逐 辑 控制 中 有 关 变 量 名 的 定义 如 图 8.10 所 示 。 





图 8. 10 模糊 还 辑 控制 中 变量 名 的 定义 图 解 

论 域 中 的 量 是 精确 量 。 通 常 可 以 定义 误差 的 基本 论 域 为 [- 四 区， 误差 变化 的 基本 论 
域 为 [-p?， 人 如。 模糊 控制 器 的 输出 信号 《控制 量 ) 的 实际 变化 范围 是 控制 量 的 基本 论 志 ， 
通常 定义 为 [-7， 刀 ， 它 也 是 精确 量 。 妨 心 了 分 别 为 正 整 数 。 为 了 确保 各 模糊 子 集 能 具 
有 较 好 的 绪 盖 率 ， 避 免 出 现 失控 现象 ， 通 常 要 求 zz6，m 空 6， 芝 7。 从 理论 上 讲 ， 增 加 
论 域 中 的 元 素 个 数 ， 计 以 提高 控制 精度 ， 但 也 带 来 了 计算 量 增 大 ， 占 用 内 存 增多 等 不 利 因 
素 。 实 际 经 验 表明 ， 按 等 级 分 得 过 细 并 没有 太 大 必要 。 对 论 域 选 择 由 于 在 系统 调试 时 对 被 
控 对 象 缺乏 足够 的 经 验 知识 ， 因 此 只 能 作 初 步 的 确定 ， 在 实际 调试 时 再 加 以 具体 认定 。 


8.5 确定 模糊 化 和 解 模 糊 化 方法 


由 模糊 控制 器 的 结构 可 知 ， 控 制 器 的 输入 和 输出 信号 均 是 精确 量 ， 而 进行 模 灶 推 理 需 
诡 模 糊 量 ， 这 样 就 需要 在 宰 糙 控制 算法 实现 过 程 中 ， 能 够 进行 精确 量 与 模糊 量 之 间 的 相互 
转换 ， 
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8.5.1 模糊 化 方法 


将 精确 量 《 实 际 上 荐 数字 量 ) 转化 为 模糊 盟 的 过 程 称 为 模糊 化 或 称 为 模糊 量化 。 模 糊 
化 与 自然 语 专 的 含糊 和 不 精确 相 联系 ， 这 是 一 种 主观 评价 ， 它 把 测量 值 转换 为 主观 重 值 的 
评价 。 山 此 ， 它 可 定义 为 在 确定 的 论 域 中 将 疯 察 到 的 输入 空间 转换 为 模糊 集 的 映射 。 在 处 
理 本 质 上 无 论 是 主观 还 是 客观 的 不 确定 信息 中 ， 模 类 化 都 扮演 着 重要 角色 。 

模糊 控制 规则 中 前 提 的 语言 变量 梅 成 模糊 给 入 空间 ， 结 论 的 语言 变量 构成 模糊 输出 空 
间 。 每 个 语言 变量 的 取 值 为 一 组 模 灶 语言 名 称 ， 称 为 模糊 标记 。 它 们 构成 了 语音 名 称 的 集 
合 ， 每 个 模糊 标记 对 应 一 个 异类 集合， 对 于 每 个 语言 变量 ， 所 取 值 的 模糊 集合 都 具有 相同 
的 论 域 。 这 些 模 糊 标 记 遂 常 均 具 有 -- - 定 的 含义 一 般 而 音 ,“ 大 、 申 、 小 ”三 个 词汇 常 被 
大 们 用 来 描述 输入 和 输出 变 旦 的 状态 。 出 于 人 的 行为 在 正 、 负 两 个 方向 的 判断 基本 是 对 称 ， 
将 大 、 中 、 小 再 加 上 正 、 货 两 个 方向 《 极 性 》 并 考虑 零 状 态 ， 这 样 一 共 就 有 了 个 词汇 ， 可 
组 成 ?7 个 模糊 标记 ， 即 : 

{ 负 大 ， 负 中 ， 负 小 ， 堆 ， 正 小 ， 正 中 ， 正 大 ] 
或 用 英 立 字 头 书写 的 形式 表示 为 : 
{INE，NM，NS，Z，PS，PM，PB} 

对 误差 的 变化 这 个 输入 变 盘 ， 在 选择 描述 其 状态 词汇 时 ， 第 冲 将 “ 雷 ” 分 别 为 “ 正 零 ” 
和 “和 负 零 ”% 以 表示 误差 的 变化 在 当前 是 “增加 ”趋势 还 是 “减少 ”趋势 。 于 是 词 集 又 增 
加 “ 正 零 ”5PZ) 和 “ 负 零 ”(NZ)。 

一 般 采 用 ?7 个 一 11 个 模糊 标记 把 连续 变 基 分 成 有 限 的 若干 档 ， 每 一 档 表 示 该 变量 的 
一 种 模糊 状态 。 有 时 也 可 设 有 5 个 模糊 状态 ， 甚 至 足 采 用 3 个 模 焰 状 态 。 所 用 模糊 状态 越 
少 ， 模 灶 控 制 规则 的 条 件 组 合 数目 就 越 少 ， 从 总 体 上 说 ， 控 制 算 法 就 越 简单 而 粗略 。 反 之 
设 定 的 模糊 状态 数 越 和 多 ， 其 规则 数 就 越 洛 ， 规 则 制定 就 更 细致 ， 在 模糊 规则 设计 合适 的 情 
况 下 ， 控 制 就 可 更 平滑 : 但 足 同 时 规则 变 香 更 复杂 ， 并 且 运 算 量 加 大 ， 由 此 在 处 理 器 的 运 
算 速 度 不 足够 快 的 情况 下 ， 就 者 可 能 影响 控制 的 实时 性 。 所 以 在 确定 模糊 标记 时 ， 要 根据 
目标 兼顾 考虑 或 通过 计算 机 模拟 仿真 洲 箭 定 。 

描述 输入 和 输出 变量 词汇 都 具有 模糊 特性 ， 可 用 模糊 集合 来 表示 。 因 此 ， 模 糊 集 合 的 
确定 问题 就 转化 为 求 取 模 糊 集 合 隶 属 函数 的 问题 了 。 

由 于 模糊 变量 没有 明确 的 外 延 ， 如 何 用 有 具体 数据 来 刻画 一 个 模糊 变量 的 性 质 ， 这 就 是 
模糊 子 集 的 确定 条 题 。 对 模糊 子 集 的 理想 要 求 是 它 必须 客观 地 反 了 脆 实 际 情况 。 

定义 一 个 异 糊 子 集 ， 实 际 上 就 是 要 确定 模 精子 集 隶 属 函 数 晶 线 的 形状 。 将 确定 的 隶 
属 函 数 曲线 离散 化 ， 就 得 到 有 限 个 点 上 的 隶 尾 度 ， 便 榴 成 了 一 个 相应 的 模 灶 变 量 的 子 集 。 
统计 结果 表明 , 用 正 态 型 模糊 变 量 来 描述 人 进行 控制 活动 的 模糊 概念 是 比较 适宜 的 。 并 且 ， 
束 属 函 数 晶 线 形状 较 尖 的 求 属 愤 糊 子 集 ， 其 分 辩 率 较 高 ， 控 制 灵 敏 度 也 高 ， 相反 ， 隶 属 函 
数 曲 线形 状 较 平 缓 ， 控 制 特性 也 就 比较 平缓 ， 稳 定性 能 也 较 好 。 因 此 ， 在 和 奈 择 模糊 变量 的 
隶属 函数 时 ， 在 误差 较 大 的 区 域 采 用 低 分 辨 率 的 模糊 集 ， 在 误差 较 小 的 区 选用 较 高 分 辨 率 
的 模糊 集 ， 在 误差 接近 于 零 时 选用 高 分 辩 率 的 模糊 集 ， 这 样 才能 达到 控制 精度 高 而 稳定 性 
好 的 控制 效果 。 
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从 自动 控制 的 角度 来 看 ， 希 望 一 个 控制 系统 在 要 求 的 范围 内 部 能 够 很 好 实现 控制 。 模 
糊 探 制 系统 设计 时 也 要 重视 这 个 问题 。 因 此 , 在 选择 描述 某 一 模糊 变量 的 各 个 模糊 子 集 时 ， 
要 使 它们 在 整个 论 域 上 的 分 布 合理 ， 即 它们 庶 该 较 好 地 履 盖 整个 论 域 。 隶 属 函 数 的 分 布 原 
则 应 当 是 ， 

作 论 域 中 的 每 个 点 应 该 属于 至 少 一 个 隶属 函数 的 区 域 ， 同 时 它 一 般 应 该 属于 不 多 于 两 
个 隶属 函数 的 区 域 ; 

四 对 同一 个 输入 没有 两 个 隶属 函数 同时 具有 最 大 隶属 度 ; 

图 当 两 个 隶属 函数 重合 时 ， 重 登 部 分 的 任何 点 的 隶属 函数 之 和 应 该 不 大 于 1。 

在 模糊 控制 应 用 中 ， 被 观察 量 通常 是 确定 的 量 。 因 为 在 模糊 逻辑 深 制 中 的 操作 是 基于 
模糊 集合 理论 ， 因 此 首先 必须 先进 行 模糊 化 。 模 糊 逻 辑 控制 的 设计 经 验 为 我 们 提出 模糊 化 
的 主要 方法 有 以 下 两 种 。 

1) 精确 量 离散 化 

精确 量 的 离散 化 是 通过 模糊 集合 的 隶属 度 函 数 将 精确 值 模糊 化 的 。 对 于 论 域 为 离散 ， 
且 元 素 个 数 为 有 限时 ， 模 糊 集合 的 求 属 度 阔 数 可 以 用 向 盟 或 者 表格 的 形式 来 表示 。 如 把 在 
[-4，+4] 之 间 变 化 的 连续 量 分 为 7 个 标记 ， 每 一 个 标记 对 应 一 个 模糊 集 ， 这 样 处 理 使 模糊 
化 过 程 比较 简单 。 否 则 ， 涤 每 一 精确 量 对 应 一 个 模糊 子 集 ， 有 无 穷 多 个 模糊 子 集 ， 使 模 灶 
化 过 程 复 杂 化 。 必 须 强调 指出 的 是 ， 实 际 上 的 输入 变量 〈 加 误差 和 误差 的 变化 等 ) 都 是 连 
续 变 化 的 量 ， 通 过 模糊 化 处 理 ， 把 连续 量 离散 为 [-4，+4] 之 间 有 限 个 整数 值 的 敌 法 是 为 了 
使 模糊 推理 合成 的 方便 。 此 时 ， 采 用 数值 方法 用 表格 描述 隶属 度 的 例子 如 表 8. 1 所 示 。 表 
中 每 一 行 表示 一 个 模糊 集合 的 未 属 度 函 数 。 例 如 : 




















对 于 论 域 为 连续 的 情况 ， 隶 属 度 常 常 采用 函数 的 形式 来 描述 ， 最 常见 的 为 三 角形 函数 
和 指数 形 获 数 。 如 指数 形 函 数 的 解析 式 为 : 
(2 和 


RatJ=e 2 
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其 中 ，z 基 隶属 度 函 数 的 中 心 值 ，“ 是 方差。 

2 ) 单 值 模糊 化 方法 

单 值 模糊 化 方法 是 将 在 某 区 间 的 一 个 精确 量 转 换 成 确定 论 域 中 的 模糊 单 值 ， 使 其 仅 在 
该 点 处 的 隶属 度 为 1， 而 其 他 各 点 隶属 函数 南 为 0。 单 值 模糊 化 通常 又 称 为 取 “ 棒 形 ”或 
“ 工 形 ” 求 属 冰 数 。 本 质 上 ， 模 糊 单位 仍 是 一 个 确定 值 ; 因此 ， 在 这 种 模糊 化 过 程 中 并 没 
有 引入 模糊 性 ， 然 而 在 模糊 控 制 虐 用 中 ， 这 种 方法 由 于 使 人 感到 自然 和 易于 实现 而 得 到 了 
广泛 应 用 。 








8.5.2 解 模 糊 判 决 方法 


如 上 上 所 述 ， 经 过 异类 推理 得 到 的 摔 制 给 出 是 一 个 模糊 隶属 函数 或 者 模 类 子 集 ， 它 反映 
了 控制 语言 的 模糊 性 质 ， 这 是 一 种 不 同 取 但 的 组 合 。 然 而 在 实际 应 用 中 要 控制 一 个 物理 对 
儿 ， 只 能 在 某 一 个 时 刻 有 一 个 确定 的 控制 量 ， 这 就 必须 要 从 异类 输出 隶属 函数 中 找 出 一 个 
最 能 代表 这 个 模糊 集合 及 模 灶 控 制作 用 可 能 性 分 布 的 精确 最， 这 就 是 解 模糊 
《Defuzzification)。 从 数学 上 讲 ， 这 是 一 个 从 和 输出 论 域 所 定义 的 模糊 控制 作用 空间 到 精确 
控制 作用 空间 的 映射 。 租 模糊 可 以 采用 不 同 的 方法 ， 用 不 同 的 方法 所 得 到 的 结果 也 是 不 同 
的 。 理 论 上 用 质心 法 比较 合理 ， 但 是 计算 比较 复杂 ， 故 在 实时 性 要 求 高 的 系统 中 有 时 不 采 
用 这 种 方法 。 最 简单 的 方法 是 最 大 来 属 度 方 法 ， 这 种 方法 取 所 有 模糊 集合 或 者 隶属 函数 中 
束 属 度 最 大 的 那个 值 作 为 输出 ， 但 是 这 种 方法 未 顾及 其 他 隶属 度 较 小 的 那些 值 的 影响 ， 代 
表 性 不 好 ， 所 以 它 经 常用 于 简单 的 系统 。 介 于 这 两 者 之 间 的 还 有 各 种 平均 法 : 如 加 相 平 均 
法 、 隶 属 度 限 幅 〈 e -cut) 元 素平 均 法 等 。 下 面 以 “水 温 适 中 ”为 例 ， 说 明 不 同方 法 的 计 
算 过 程 。 

这 里 假设 “水 温 适 中 ”的 隶属 度 池 数 为 : 

岂 NE) = {:， 0.000 +0.0110 +.033120 +0.67130 +1.0140 +1.0150 


+ 0.7S/60 + 人 5770 + 0.25780 +0.090+ 0.0/1001 
1) 顾 惰 法 
所 谓 质心 法 ， 芍 赴 取 模糊 隶属 度 男 数 曲 线 与 横 举 标 输 围 成 面积 的 质量 中 心 作为 代表 
点 。 理 论 上 说 ， 我 们 应 该 计算 输出 范围 内 一 系列 连续 点 的 重心 ， 即 ; 


jeod 


| 吧 Godx 


但 实际 上 我 们 是 道 过 计算 输出 范围 内 整个 采样 点 《〈 即 若干 离散 值 ) 的 质心 。 这 样 在 不 花 太 
多 时 间 的 情况 下 ， 用 足够 小 的 取 祥 间 邱 米 提 供 所 需要 的 精度 ， 这 是 一 种 最 好 的 折衷 方案 。 
即 : 


《8.27 
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之 
DA 人 
=(0.0.0+0.0.10+.033.20+0.67.30+1.0.40+1.0.50 
+0.75.60+0.5.70+0.25.80+0.0.90+0.0:100) 《8.3) 
A0.0+00+033+0.67+10+10+0.75+05+0.25+0.0+0.0) 
一 48.2 
2 ) 最 大 东 属 度 法 
这 种 方法 最 简单 ， 只 要 在 推理 结论 的 模糊 集合 中 取 隶 属 度 最 大 的 奢 个 元 索 作 为 输出 量 
即 可 。 不 过 要 求 这 种 情况 下 其 隶属 度 函 数 曲 线 一 定 是 正规 凸 模糊 集合 〈 即 其 曲线 只 能 是 单 
峰 曲 线 )。 如 果 该 曲线 是 梯形 平 顶 的 ， 那 么 具有 最 大 隶属 度 的 元 素 就 可 能 不 止 一 个 ， 这 时 
就 要 对 所 有 取 最 大 隶属 度 的 元 素 求 平 均值 。 
例如 对 于 “水 温 适 中 ” 按 最 大 隶属 度 原 则 ， 有 了 两 个 元 素 40 和 和 具有 最 大 隶属 度 1.0， 
那 就 要 对 所 有 取 最 大 来 局 度 的 元 素 40 和 50 求 平 均值 ， 执 行 量 应 取 : 


kmax =(40+50)72= 45 《8.4) 


该 方法 简便 易 行 ， 实 时 性 也 好 ， 但 它 概 括 信 息 量 少 ， 因 为 它 完全 不 考虑 其 余 一 切 从 属 
程度 较 小 点 的 情况 。 
3) 系数 加 权 平 均 法 
这 种 方法 就 是 恢 照 普通 加 权 平 均 公 式 ， 按 下 式 来 计算 控制 量 ; 
_ 之 各 如 
区 
这 里 的 系数 总 前 选择 要 根据 实际 情况 而 定 ， 不 同 的 系数 就 决定 系统 有 不 同 的 响应 特 
性 。 当 该 双 数 选择 忆 =Anwtxz) 时 ， 即 取 其 隶属 函数 时 ， 这 就 是 质心 法 。 在 模糊 逐 辑 控制 
中 ， 可 以 通过 选择 和 调整 该 系数 来 改善 系统 的 响应 特性 ， 这 种 方法 具有 灵活 性 。 
4) 录 属 度 限 幅 元 素平 均 法 
用 所 确定 的 来 属 度 值 c 对 隶属 函数 曲线 进行 切割 ， 再 对 切割 后 等 于 该 未 属 度 的 所 有 
元 素 进 行 平均 ， 用 这 个 平均 值 作 为 输出 执行 量 ， 这 种 方法 就 称 为 隶属 度 限 幅 《rm -eut) 元 
素平 均 法 。 
例如 ， 当 取 cx 为 最 大 隶属 度 值 时 ， 表 示 “ 完 全 素 属 ”关系 ， 这 时 r 一 10。 在 “水 温 
适中 ”的 和 情况 下 ，40C 和 50PC 的 隶属 度 是 1.0， 求 其 平均 值得 到 输出 代表 量 ; 
zt =(d40+50)712=45 
当 w = 0.5 时 ， 表 示 “ 大 概 隶 属 ” 关 系 ， 切 割 素 属 度 函 数 曲 线 后 ， 这 时 假定 从 30 包 到 
70C 的 束 属 度 值 都 包含 在 其 中 ， 所 以 求 其 平均 值得 到 输出 代表 量 : 
=(30+40+50+60+70)75=50 
另外 ， 单 值 法 也 常用 于 解 模糊 中 。 


(8.5) 
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8.6 模糊 控制 规则 


模糊 控制 规则 是 设计 模糊 控制 如 的 核心 ， 因 此 如 何 建立 模糊 规则 就 成 为 一 个 十 分 关键 
的 问题 。 模 糊 近 制 器 控制 规则 的 建立 应 该 是 人 们 在 手动 控制 过 程 中 经 过 长 期 实践 ， 不 断 修 
正 完 善 的 一 套 行 之 有 效 的 控制 策略 。 模 糊 控 制 器 的 最 大 特点 就 是 只 要 有 了 有 经 验 的 操作 者 
或 专家 给 出 的 控制 规则 ， 就 可 以 根据 所 选 定 的 模糊 推理 方法 获得 合理 的 控制 量 。 一 般 情 况 
下 是 通过 以 下 几 种 方式 来 获得 模糊 控制 规则 的 。 

1) 基于 专家 的 经 验 和 控制 工程 知识 

模糊 控制 规则 具有 横 糊 条 件 名 的 形式 ， 它 建立 了 前 件 中 的 状态 变量 与 乒 件 中 的 控制 变 
量 之 间 的 联系 。 通 过 总 结 人 类 专家 的 经 验 ， 并 用 适当 的 语言 来 加 以 表述 ， 最 终 可 表示 成 横 
糊 控 制 规则 的 形式 ， 或 通过 获得 特定 应 用 模糊 控制 规则 的 原理 ， 再 经 一 定 的 试 凌 和 调整 ， 
可 获得 具有 更 好 性 能 的 控制 规则 。 

2) 基于 操作 人 员 的 实际 控制 过 程 

在 许多 人 工控 制 的 工业 系统 中 ， 很 难 建立 控制 对 象 的 模型 ， 因 此 采用 常规 的 控制 方法 
来 对 其 进行 设计 和 仿真 比较 困难 。 然 而 熟练 的 操作 人 员 却 能 成 功 地 控制 这 样 的 系统 。 事 实 
上 ， 操 作 人 员 有 意 无 意 地 使 用 了 一 组 IF-THEN 模糊 规则 来 进行 控制 。 但 是 他 们 往往 并 没 
有 语言 明确 地 将 它们 表达 出 来 ， 因 此 可 以 通过 记录 操作 人 员 实 际 控制 过 程 时 的 输入 /输出 
数据 ， 从 中 总 结 出 模糊 控制 规则 。 

3 ) 解析 控制 规则 公式 

在 经 验 所 获 规则 不 全 曾 或 根本 没有 经 验 规则 的 情况 下 ， 可 以 采用 以 下 的 解析 控制 规则 
公式 。 

(1) 简单 的 解析 移 制 规则 

在 简单 的 模糊 控制 规则 的 算法 中 ， 可 将 误差 e、 误 差 变 化 率 ec 和 控制 量 & 之 间 的 控 
制 规则 表示 为 如 下 的 解析 公式 ， 

，。 十 如 
一 《8.6) 

其 中 ，int 表示 取 整 。 

采用 解析 表达 式 描 述 的 控制 规则 简单 方便 ， 使 得 输入 和 输出 之 间 的 关系 式 可 以 直接 进 
行 计 算 ， 更 易于 计算 机 的 实时 控制 。 

(21) 带 有 一 个 可 调 因子 的 控制 规则 

从 模糊 控制 规则 的 解析 表达 式 (8. 6) 中 可 见 ， 控 制作 用 的 大 小 仅 取决 于 误差 和 误差 的 
变化 ,并 且 对 两 者 采 取 同样 的 重视 程度 .为 了 适应 不 同 的 被 控 对 象 的 控制 性 能 要 求 , 在 (8.7) 
式 的 基础 上 引入 一 个 调节 因子 w ， 则 可 得 到 一 种 带 有 一 个 调整 因子 的 控制 规则 : 

L 三 一 intfe 二 人 一 wecl (8.77) 

改变 w 的 大 小 ， 意 味 着 对 误差 和 误差 的 变化 不 同 的 重视 程度 。 实 验 结 果 表 明 ， 当 被 
控 对 象 阶 次 较 低 时 , 应 取 c > 0.5; 相反 , 当 被 控 对 象 阶 次 较 高 时 , 应 取 w< 0.5: 当 取 w = 0.5 
时 ，(3.7) 式 就 变 成 (8.6) 式 了 。 

(3》 带 有 多 个 可 调 因子 的 控制 规则 
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如 果 对 不 同 的 误差 等 级 引入 不 同 的 调整 因子 的 值 ， 就 可 构成 带 有 多 个 可 调 因子 的 控制 
规则 , 这 种 设计 方式 有 利于 满足 控制 系统 在 不 同 被 控 状 态 下 对 调整 因子 的 不 同 要 求 . 例如 ， 
当 误 差 *、 误 差 变 化 率 ec 及 控制 量 半 的 论 域 取 为 : 

{e]={fecel={fo={ 全 3 一 2 一 0 23} 
则 带 有 多 个 可 调 因子 的 控制 规则 可 示 为 : 


一 intl2ne 十 亿 一 Co)ec]，e=0 
一 int[wie 十 位 一 多 il)ec]， ee= 土 | 
|]-intfa2e+ 人 -aojecl，e= 辽 
一 int[w3e+ 人 一 Q3jecj，e= 二 3 


{8.8) 


其 中 调整 因子 ao 、awl 、a2 、D3 ef0,. 1)。 


必 基 于 学 习 

许多 模糊 控制 主要 是 用 来 模仿 人 的 决策 行为 ， 但 很 少 能 够 根据 经 验 和 知识 产生 模糊 控 
制 规则 并 对 它们 进行 修改 的 能 力 。 随 着 模糊 自 组 织 控制 以 及 神经 模糊 系统 的 出 现 ， 使 得 模 
糊 控 制 器 具有 自身 学 习 能 力 ， 并 具备 了 通过 学 习 产 生 合适 的 控制 规则 的 能 力 。 


8.7 模糊 丈 辑 推理 


模糊 推理 是 设计 模糊 控制 器 的 关键 。 常 用 的 模糊 控制 规则 的 推理 方法 有 三 种 : 合成 模 
类 推 理 方法 、 结 论 是 线性 函数 的 模糊 推理 方法 和 合成 推理 的 解析 公式 法 。 





8.7.1 合成 模糊 推理 法 


实际 应 用 中 使 用 较 广 泛 的 合成 模 粗 推理 法 有 以 下 两 种 。 

1) 直接 推理 法 

由 量化 论 域 中 的 各 输入 量 、 和 输出 量 求 出 每 条 控制 规则 的 模糊 关系 癌 ， 再 使 用 模糊 关 
系 品 ; 计算 出 各 输出 控制 分 量 ， 最 后 算出 总 输出 控制 量 。 直 接 推 理 法 的 特点 是 不 用 计算 出 
总 的 模糊 关系 品 

2) 间接 推理 法 

由 量化 论 域 中 的 各 输入 旦 、 输 出 量 及 控制 规则 求 出 总 的 模糊 关系 只 ， 再 使 用 总 的 模糊 
关系 计 算出 输出 控制 量 。 

下 面 给 出 两 种 合成 模糊 推理 法 的 计算 公式 。 

假设 有 两 个 输入 变量 互 和 EC、 一 个 输出 变量 区 以 及 一 个 控制 规则 表 ， 其 中 ， 忠 的 模 


糊 标 记 为 4 ,42, ,4 ;EC 的 模糊 标记 为 玉 ,B2,…, 瑟 :了 的 模糊 标记 为 上 ,Co ,CI : 
控制 规则 有 囊 xza 个 ， 其 格式 为 : 
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让 出 and 吾 then (Ci 
其 中 ， 机 属于 论 域 { 和 42 4 | 
吾 属于 论 域 { 瑟 ,B2 ,有 
Cr 属于 论 域 {C1,Cz Cj 


现 有 输入 人， 本 ， 需 求 出 C”。 
3 ) 直接 法 合成 推理 公式 
Ri = 矶 xx 如 jxCi =(A x 吾 门 。 Ci 


CH = (4*xXB4)7 Ri 


Ri = 由 X 吾 jiXC (4i Xi)oCH 


站 二 
拘 , 闪 
办 二 ww , 

i=1,j=L 也 


C” =-(4*xBf]7 o 玉 
实际 上 上， 无论 采用 直接 法 还 是 间接 法 进行 模糊 逻辑 推理 ， 所 求 出 的 控制 值 都 是 相 朵 
欲 证 直接 法 与 间接 法 的 模糊 逻辑 推理 结果 一 致 ， 只 需 证 明 下 面 的 等 式 成 立 ; 


丽 , 卫 浊 
(4x 本 os。 Y 有 一 Y 《4 Xe 如 
ij/=] i=1. 1 


合成 运算 “= ”采用 最 大 一 最 小 法 的 证 明 如 下 : 


受 


AHc 人 =(4x 且 。Y 司 
芒 1,j=1 
= 和 sensCO vemkoya 
1 一 


= vaGApsCOMAL Y CR (村 
yy =1, 产 1 号 


虽 : 呈 
二 YY A 
区 ,一 


【LEAD ABC 和 天 Cr yo 相 ] 


7 


= v fen(ApsOsan Cn 
i=1,j=1 提 


= 六 1 人 4X 交 9 有 
1]. /= 
对 于 “。” 采 用 最 大 一 积 合成 法 的 情形 ， 只 要 把 上 式 中 的 到 小 运算 换 为 乘积 运算 ， 同 
拌 下 以 证 出 相同 的 结果 。 虽 然 来 用 直接 法 和 间接 法 进行 模糊 逻辑 推理 所 获 结果 相同 ， 但 从 
实际 的 计算 机 操作 中 证 实 隔 者 所 用 运算 时 间 不 同 ， 间 接 法 所 用 计算 时 间 较 少 。 
由 上 可 知 ， 实 现 上 述 推理 过 程 必 须 执 行 复杂 的 矩阵 运算 ， 计 算 工 作 痢 太太 。 因 此 ， 在 
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线 推理 时 很 难 满足 控制 系统 的 实时 性 要 求 。 正 因为 如 此 ， 在 模糊 控制 器 的 设计 中 ， 了 最 常 使 
时 的 是 一 种 所 谓 的 “查询 表 ”， 这 种 控制 器 是 通过 模糊 控制 规则 表 、 模 糊 化 的 输入 量 以 及 
合成 推理 法 ， 计 算出 输入 /输出 之 间 关 系 的 对 应 表 和 格 ， 或 称 为 “控制 表 ”， 出 计算 机 事先 离 
线 计算 好 ， 存 储 在 内 存 中 供 实时 查 表 使 用 。 实 际 应 用 时 ， 先 根据 量化 后 的 输入 误差 及 误差 
变化 值 ， 直 接 从 控制 表 中 查 表 求 出 对 应 的 输出 控制 量 ， 再 乘 以 比例 因子 ， 即 可 作为 输出 去 
控制 被 控 对 象 。 以 此 可 以 大 大 提高 模糊 控制 的 实施 效果 ， 节 省 内 存 空间 。 

下 和 而 采 用 间接 的 合成 推理 法 ， 重 新 对 例 7. 1， 对 科 糊 化 采用 把 输入 /输出 连续 虽 离 散 
化 为 论 域 上 的 模糊 子 集 进行 离 线 制作 控制 表 的 步骤 。 

(1) 模糊 化 

候 输 入 /控制 量 的 模糊 语言 描述 

描述 输入 /控制 量 的 语言 值 模糊 子 集 选 取 为 : 

INB，NS，Z0,. PS，PB] 

其 中 : NB = 负 大 : NS = 负 小 ; ZO = 零 ; PS = 正 小 ， PB = 正大 。 

蕊 输 入 /控制 量 的 量化 

设 温度 的 论 域 为 蕊 将 其 论 域 变化 范围 [0，40] 量 化 为 9 个 等 级 ， 量 化 因子 天 ,= 一 ， 


则 有 : 








天 = {-4， -3， -了 ， -|， 口 ，1，2，3 了 3， 才 ] 


设 湿 度 的 论 域 为 Y， 将 其 论 域 变化 范围 10%，30 驳 ] 也 量化 为 9 个 等 级 ， 量 化 因子 为 


下 -二 ， 则 有 : 
3 


了 
7 了 = {-4，-3，-2，-1，0，1，2，3，4]} 
设 控制 量 效 水 时 间 的 论 域 为 7， 将 其 论 域 变化 范围 r0，7g] 同 样 量 化 为 9 个 等 级 ， 旦 
为 玉 = .了 ， 则 有 : 
化 困 子 为 瑟 ， =7， 则 有 : 
Z={-4，-3，-2，-1，0，1，2，3，4] 
贪 输入 /控制 量 来 属 函 数 的 建立 
选用 等 距离 三 角形 作为 输入 /控制 量 的 求 属 函 数 ， 如 图 8.11 所 示 。 





图 8. 11 输入 /控制 量 的 束 属 函数 
由 模糊 化 表 的 建立 CX，P 2 
为 了 便于 制 表 ， 将 输入 、 输 出 变量 值 道 过 论 域 离散 化 ， 用 有 限 个 数 虽 值 表 示 出 其 与 隶 
属 函 数 之 间 的 美 系 式 ， 即 通过 作 表 法 米 完 成 异 糊 化 过 程 。 本 例 中 的 两 个 输入 X 和 了 以 及 
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和 输出 z 的 模糊 化 表 具 有 相同 的 形式 ， 如 表 8.2 所 示 。 
表 8.2 隶属 函数 的 离散 化 表格 
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(2) 模 贿 控制 规则 表 的 建立 
模糊 控制 规则 表 如 表 8.3 所 示 。 


表 8. 3 模糊 控制 规则 表 





号 控制 表格 的 建立 《采用 间接 推 理 法 》; 

四 求 邓 . 

a 由 模糊 化 表 可 知 : 
4i= 呈 = CO=AB= (1.0.50.0.0.0.0.0.0) 
42= 盏 = 品 = NS = (0.0.5,1.0.5.0.0.0.0.0) 
4= 已 = 所 = Z0O =(0.0.0.0.5.1.0.5.0.0.0) 
44= 盏 = Ci= PS = (0.0.0.0.0.0.5.1.0.5.0) 
Ai= 卫 ,= 0C5= PB = (0.0.0.0.0.0.0.0.5, 日 

bj 由 模 类 探 制 规则 


如 果 七 是 由 ， 且 了 是 画 ， 那 么 Z 是 上 1; 


如 果 半 是 NB， 且 了 在 NB， 那 么 忌 是 2B; 


结合 模糊 控制 规则 泰 ， 可 得 : 

Ci = Cao=(<a=PB 

Ca3=Cu=Co=Ca=C3= Cao=Ca= 站 

Cis= Ca= Cxs=Cna= Cd=Co=Co=Co=Co2=20 

C5= Cu=C4=C5a= CR 

[ss 二 六 呈 

Ri =4x 呈 jxXCy =(4ix 呈 DoCy 
其 中 (4 x 吾 ))I1 表 示 将 矶 X 轧 ) 按 行 拉 直 成 行 向 量 ， 再 转 置 成 列 向 量 。 
c) 求 模 糊 关 系 矩 阵 丸 


[=5, 产 5 
R= jj 访 
il 
通过 计算 机 计算 ， 癌 得 模糊 关系 和 矩 阵 Ra x%。 
( 3 ) 计算 控制 量 C ”的 矩阵 
Cr=(4+xB9T2 oo 玉 

其 中 的 (4*xBsyT2 表示 将 4A*xBx* 按 行 拉 直 成 行 向 量 。4 和 书 为 分 别 取 {NWB，KNS，Z0O， 
PS，PBj 中 不 同 的 模糊 量 值 ，C ”为 所 对 应 的 值 。 

将 上 述 推理 过 程 编 成 程序 ， 通 过 计算 机 求解 后 可 得 对 于 输入 变量 论 域 {-4，-3，-2，-1， 


0，1，2，3，4j 中 的 每 一 组 输入 ， 所 对 应 的 控制 器 的 输出 Cy 人 = 1 2 .… 多 的 隶属 度 。 
如 : 


CI =《0.0.0.0.0.0,0.0.5,1): 


CTD= 《0.0.0.0.0.0.0.0.5.0.5); 


C21= (0.0.0.0.5,1.0.5.0.0.0); 


C2> = (0.0.0.0.0.0.0.0.5.0.5) : 


Cj = (0.5.0.3.0.5.0.5.0.0.0.0.0); 


Coo =【〔〈1.0.5.0.0.0.0.0.0.0)。 
(4 ) 解 模 业 





根据 公式 鼠 = 学 亲 ， 通 过 编程 由 计算 机 分 别 计算 后 可 得 到 对 输入 论 域 中 不 同 离散 值 
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的 输出 控制 表 如 表 8. 4 所 示 。 
表 8. 4 模 精 控 制 器 的 控制 表 


国 国 国 国 国 国 国 国 国 





很 显然 ， 这 种 制 表 法 不 同 手 我 们 例 7. 1 中 所 采用 的 方法 ， 主 要 的 不 相同 点 在 于 制 表 法 
中 采用 的 是 将 输入 及 输出 变量 在 整个 论 域 上 的 连续 量 模糊 化 为 有 限 个 数 的 量化 值 ， 责 例 
7, 1 中 输入 /输出 变量 的 模糊 化 采用 的 是 直接 通过 模糊 隶属 函数 进行 单 值 模糊 化 ， 为 了 说 
明 问 题 的 方便 起 见 ， 这 里 以 三 角形 隶属 函数 为 例 来 说 明 其 输出 分 量 的 求解 过 程 。 

先 考虑 只 有 一 条 控制 规则 的 情况 。 设 有 模糊 推理 语句 : 

及 11 1 如 果 + 是 和 and 7 是 也] ， 那么 z 是 Cl11 
其 中 出 Efela2.a3}， 而 E [852, 反 ] ，CH e fclc2,c3] ，al ga2,a3, 列 82. 83, cl c2, c3 分 别 
表示 变量 六 z 在 各 自 论 域 中 离散 点 处 的 隶属 度 。 

全 求 此 规则 的 草 售 关系 妨 ; =(4i and 矶 ) 一 Cl 

若 对 于 4 and 轧 采 用 求 交 运 算 ， 殖 含 关系 采用 最 小 运算 ， 可 得 : 

and8 = 由 xx 而 =4 和 已 

好 


如 之 
C3 


和 ^ 思 妇 扫 ] 








= |a2Ail 62Ap2 02AB3 
23ARBL 6093ApP2 3ADS 


为 了 便于 下 面 进一步 的 计算 ， 可 将 而 x 画 的 模糊 和 阵 表示 成 如 下 的 拉 直 行 向 量 的 转 
置 


区 alAa2 alLA 的 





TI 
是 ax 胁 = (由 x 有 ij) 
= 人 ex 下 al 了 2 el 区 6a2A 站 62A 了 2 上 2A 耻 扫 A 中 9 和 所 a3AB3 
从 而 草 合 关系 : 


了 
晤 一 (4 and 已 ) 一 ii = (4 x 马 ) AC 


BAptinAel 是 A 到 Ace 本 和 A 下 和 从 
GLAp2Acl ealnAa2nc2 GANAc3 


23Ap3Ael 63A23Ac2 83A53Ac 
加 计算 输入 量 的 模糊 集合 4 and 忆 
当 有 输入 ?和 7 激活 了 模糊 控制 规则 恺 | ， 由 于 此 时 采用 单 值 模 贿 化 ， 可 得 姑 = 由，y 
一 盏 为: 
4=(100)， 8=(100) 





则 有 
100 
4xa=l000 
000 
同样 为 了 后 面 合成 的 方便 ， 需 将 而 x 囊 拉 直 成 行 向 量 ， 
久 计 算 输出 分 量 Ci 


根据 最 大 一 最 小 合成 推理 方法 ， 对 应 的 输出 Ci 为 
Ci = (4 X 吾 )oRR， 
= (0.0.0.0.0.0.0.0)o 尺 ， 
= (SA 中 AClalAHAc2elA 列 Ac 
或 者 ， 对 于 同一 输入 吧 = 而 ，y = B， 有 可 能 会 有 


4A=(100)，B=(010) 
此 时 
侨 
人 


0 1 
4xB=|00 
0 0 








闻 理 ， 需 将 和 x 囊 拉 直 成 行 向 量 ， 然 后 根据 最 大 一 最 小 合成 推理 方法 ， 对 应 的 输出 


Cil 为 : 


IT29 


Ci1= (41x 囊 )oRl 
= (01.0.0.0.0.0,0.0)eRR1 
= (alABb2Acl 时 AD2Ac2al1Ap2Ac3 


以 此 类 推 ， 不 难 发 现 对 于 而 的 论 域 和 而 的 论 域 ， 不 管 它们 的 元 素 有 多 少 ， 当 国 量 化 
之 后 只 会 选中 某 一 个 元 素 ， 例 如 第 了 个 元 素 ， 并 且 具 有 该 元 素 的 如 属 度 为 1， 其 余 均 为 0， 
即 有 : 

4A=( 05010900) 
第 了 个 

同 理 ， 岛 量化 后 也 会 只 选中 某 一 个 元 素 ， 例 如 第 了 个 元 素 ， 且 只 有 该 元 素 的 隶属 度 

为 1， 其 余 均 为 0， 即 有 : 


B=(《0...,01,0,...,0 ) 
第 .7 个 
此 时 不 难得 到 Ci 为 ; 


Aci 


当 有 输入 ?和 ”， 可 能 激活 其 他 模糊 控制 规则 ， 如 Ri2 : 
R2: 如 果 工 是 由 and 了 是 . 瑟 ， 那 各 ?是 口 3 
同 理 ， 可 求 得 其 对 应 输出 为 : 


Ac， = 下 4 《 划 和 下 B2 (ARC 2 


| 天 (从 和 (CARCi ( 


由 求解 kc;， 和 Ac 的 算式 表明 ， 对 于 输入 “和 7， 它 所 激活 的 每 一 条 模糊 控制 规则 


的 输出 分 量 等 于 用 输入 变量 x，y 对 隶属 函数 的 模糊 集合 上 所 获得 的 隶属 度 进行 相互 结合 ， 
分 别 取 其 中 较 小 的 值 作为 总 的 模糊 推理 前 担 的 隶属 度 ， 再 以 此 为 基准 去 切割 推理 结论 的 隶 


属 函数 ， 结 论 ke; 等 于 Ae 被 激活 强度 条 位 后 的 结果 。 输 入 为 单 值 模糊 化 ， 推 理 采用 最 大 
3 站 


一 最 小 合成 法 时 的 图 形 解 释 如 图 8.12 所 示 。 

根据 以 上 每 一 条 模糊 控制 规则 输出 分 量 的 计算 公式 可 以 看 出 ， 当 输入 采用 单 值 模糊 化 
时 ， 所 对 应 的 输出 模糊 量 的 推理 过 程 将 大 大 简化 ， 对 于 给 定 的 输入 变量 r 和 m 只 要 在 和 输 
入 变量 的 论 域 与 隶属 函数 的 关系 式 ( 图 ) 中 分 别 求 出 与 之 对 应 的 所 有 模糊 标记 上 的 隶属 度 ， 
然后 对 隶属 函数 的 模糊 集合 上 所 获得 的 隶属 度 进行 两 两 结 台 ， 构 成 由 输入 变量 所 激活 的 模 
糊 控 制 规则 。 另 一 方面 ， 从 设计 隶属 函数 的 角度 我 们 已 知道 ， 通 常 对 于 同一 个 论 域 值 ， 所 
相交 的 隶属 函数 的 数目 不 多 于 两 个 ， 所 以 对 于 输入 变量 x* 和 ?， 所 激活 的 模糊 控制 规则 的 
数目 一 般 不 会 多 于 4 (=2+2 ) 个 ， 所 以 这 种 模糊 推理 运算 法 极 大 地 简化 了 运算 过 程 ， 并 
且 对 于 输入 量 不 需要 进行 量化 处 理 ， 可 以 直接 进行 单 值 模 糊 化 ， 从 这 点 上 讲 ， 可 以 提高 扒 
理 精度 。 在 实际 应 用 的 实时 计算 处 理 中 通常 均 采 用 此 种 操作 。 
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US 下 一 Ai “一 -本 


有 上 h 
4 有 CI 


全 全 全 
人 TH 内 


4 如 吾 2 人 22 
人 一 办 
下， 下 区 了 Z 
几 
CIIUC22 
羡 


图 8. i2 输入 为 模糊 单 值 且 采 用 最 大 一 最 小 进行 模糊 推理 时 的 图 形 解 释 


下 面 给 出 输出 变量 C" 完整 的 模糊 推理 求解 过 程 。 
人 @ 对 于 每 一 组 精确 的 输入 变量 值 (my》 通过 模糊 化 隶属 孙 数 图 ， 求 得 输入 值 对 应 在 
各 模 燃 标记 上 的 隶属 度 ai = Ha (可 ， 有 =pa (7 ，a2z =Ht (和 有 =Ha (7。 由 此 激活 
控制 表 中 与 之 发 生 作用 的 控制 规则 〈 一 般 只 有 4 条 )， 例 如 激活 了 ; 
Ca CD HOC (Da ca C9A 0，Ca Dam 0 
@@ 通 过 对 隶属 度 的 最 小 运算 获得 所 对 应 的 规则 的 隶属 度 


隶属 度 控制 规则 
(xl 和 二 ) Can 房 
(CI 有 2) Cao,p 
《cx2 ^ 庙 ) Cop 已 
(2z 入 及) Cao2,B2 


图 利用 取 最 大 值 的 方法 求 出 输出 变量 的 隶属 度 ， 即 如 果 Co 8 ，Co 和 ，Co 8 和 
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Co ,8. 中 的 模糊 标记 有 重复 的 ， 则 从 中 取 隶 属 度 较 大 的 值 。 

电解 模糊 。 通 过 同样 的 解 模 糊 法 《例如 质心 法 ) 求 出 其 精确 值 。 

此 方法 的 优点 是 由 于 不 需要 对 每 一 组 输入 值 在 所 有 的 mxm 个 规则 里 进行 模 糯 推 理 操 
作 ， 其 计算 量 远 远 小 于 上 述 制 表 法 中 所 采用 的 方法 ， 该 方法 很 适合 用 于 在 线 实时 计算 控制 
输出 量 ， 并 且 在 实际 计算 时 不 需要 对 输入 进行 量化 处 理 ， 直 接 由 精确 输入 值 所 对 应 的 各 模 
糊 标 记 的 束 属 度 求 出 对 应 的 输出 。 


8.7.2 结论 是 线性 函数 的 模糊 推理 方法 


这 种 模糊 推理 法 的 特点 是 挫 理 的 结论 部 分 是 前 提 语 言 变量 值 的 函数 , 又 称 为 Sugeno 推 

理 法 。 一 般 形式 为 : 
证 xzL=4land x2=42and…xz=4nrandthen y= 了 (zxX2 3) 
结论 国 数 的 简单 形式 可 表示 为 : 
证 Xi=As and xz2=42 and…3Wi=4n and thet 7= POPIxXLA… 十 PP 

在 上 面条 件 语句 中 ，xl22,..m 是 语言 变量 ，41.42...4n 是 语言 变量 值 ，p0p1.pm 
是 系数 。 
对 于 有 卡 条 规则 的 模糊 控制 ， 则 可 表示 为 : 

六 证 车 =4Uand 好 | 一 42iand and 2 = 4i then 7 = 罗 0 十 下 ;对 十 二 pn 式 中 ,= 
1 2，. .. ,大 

设 有 输入 xz1#z25%02x， 则 输出 控制 量 的 精确 值 y 的 计算 过 程 如 下 

是 对 每 条 规则 丸 ， 计 算 其 结论 的 值 。 

有 = P0O 十 PL 好 | 十 DPIiX2i 十 … 十 PDT; 

式 中 ，i= 1，2，.…， 玫 。 

地 求 命题 ?= 3 的 真 值 ， 即 结论 的 权 值 。 

命 愿 》 = 》 的 真 值 用 |w| 表 示 ， 且 有 


|w， | 一 和 二 二 { 钱 ) 


人 求 输出 控制 的 精确 值 。 溯 采用 “质心 法 ” 求 精确 值 ， 则 有 : 


的 


1 


了 一 


让 


上 
上 
i=1 


计算 式 中 的 w =|y- | 

例 8.1 设 有 3 条 控制 规则 ， 且 分 别 为 : 

恕 :这 = 多 andxa= 人 then y= 如 十 X2， 

甩 : 诺 xi = 瑟 then y=2x] 

下 这 1 = 已 由 en 了 =3xl， 
式 中 ，8 表示 小 1， 品 表示 小 2， 脉 表示 大 1 也 表 示 大 2。 
132 


当 输 入 xl = 12, 好 =5 时 ， 求 输出 值 y。 

先 求 每 条 规则 结论 六 的 值 。 且 有 : 
旭 三 旭 上 +X2=]17 
yo =2xl = 24 
妈 =3x2=15 


然后 求 每 条 规则 的 权重 ， 即 有 : 
Wi = 有 OA 有 na (人 = 有 nd 和 sa 人) 
图 一 且 下 CD = 下 让 这 他 
W3 一下 2 一 站 (3) 





设 有 : 
上 3 (12) = 个 .29， 及 S> (3 一 0.375， 此 (tit27 = 0.2， 睛 囊 (S) = 0.374 
则 有 : 
W 三 站 .25， 9 一 0.2， 3 三 0.375 

因此 ， 有 精确 值 疡 

大 

互 7 

二 一 
了 一 人 =17.8 
并 Wi 


i=1 


当 只 有 一 个 规则 时 ， 上 式 中 焉 = 两 =0， 那 么 ， 这 就 相当 于 线性 控制 。 当 有 多 个 规则 
时 ， 输 入 空间 可 分 为 若干 模糊 子 空间 ， 在 每 个 子 空间 找 出 线性 的 输入 /输出 关系 ， 这 些 子 
室 间 的 集合 与 整个 的 非 线性 输入 /输出 关系 可 以 看 成 是 等 价 的。 在 这 里 因为 只 有 前 提 部 分 
是 用 语言 来 描述 的 ， 所 以 ， 它 不 像 第 一 种 模糊 推理 法 中 的 控制 规则 那样 容易 理解 ， 但 是 实 
际 上 它 的 描述 能 力也 许 是 最 好 的 ， 因 为 它 用 少数 的 语言 规则 可 生成 较 复 杂 的 非 线 性 函数 。 


8.7.3 量化 因子 及 比例 因子 的 选择 


在 实现 模糊 控制 算法 时 , 通过 每 隔 一 定时 间 (采样 周期 ) 采样 被 控 对 象 的 输出 信号 《 数 
字 量 》 后， 把 该 数字 量 和 内 部 设 定 的 数字 信号 〔 参 考 输入 信和 号 》 进行 比较 就 可 以 得 到 当前 
控制 用 的 输入 变量 信号 〈 误 差 信号 )。 前 后 两 次 采 桩 对 应 的 误差 信号 除 以 时 间 间 隅 就 是 误 
差 变 化 率 信 号 。 为 了 进行 模糊 运算 ， 必 须 把 这 两 个 精确 量 转 换 为 模糊 集 的 论 域 的 某 一 个 相 
应 的 值 。 这 实际 上 就 是 要 进行 基本 论 域 《 精 确 量 ) 到 模糊 集 的 论 域 〈 模 糊 量 ) 的 转换 ， 这 
种 转换 过 程 的 实现 就 需要 引入 量化 因子 的 概念 。 
量化 因子 一 般 用 大 表示 ， 误 差 的 量化 因子 筷 、 误 差 变化 率 的 量化 因子 玉 。 和 控制 量 
的 比例 因子 六 分 别 由 以 下 计算 公式 确定 : 
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玉 = 也 ， 天 = 了 于 ， 天 = 2 
开 。 此 ee 

设计 模糊 控制 器 除了 要 有 一 整套 有 效 的 控制 规则 外 ， 还 必须 合理 地 选择 模 棚 控 制 器 的 
量化 因子 和 比例 因子 系数 。 大 量 实验 结果 表明 ， 量 化 因子 和 比例 因子 的 大 小 及 两 个 量化 因 
子 之 间 的 大 小 相对 关系 ， 对 模 交 控制 如 的 控制 性 能 影响 极 大 ， 并 且 需 要 通过 整个 控制 系统 
的 调试 《可 先 通过 仿真 ) 来 完成 。 

1 》 4 如， 天 对 系统 动态 性 的 影响 

一 般 说 来 ， 天 、 玉 .变化 时 ， 实 际 误差 和 误差 变化 所 对 应 的 论 域 上 的 原始 值 也 将 发 生 
变化 。 玉 、 近 。 越 大 ， 对 应 的 语言 值 也 越 大 ， 反 之 亦 然 。 在 误差 变化 所 取 语 理 值 不 变 的 条 
件 下 ， 误 善 所 取 语 言 值 越 大 ， 相 应 控制 器 的 输出 〈 控 制 量 变化 ) 所 取 语 言 值 也 越 大 ， 而 在 
误差 所 取 语 言 值 不 变 的 条 件 下 ， 误 荆 变化 所 到 语言 值 越 大 ， 相 应 的 控制 器 的 输出 所 取 语 言 
值 越 小 。 

天 对 动态 特性 的 影响 是 : 下 大 ， 调 节 死 区 小 ， 上 升 速率 大 。 人 但是， 天. 取 的 过 大 ， 将 
使 系统 产生 较 大 的 超 调 ， 调 节 时 间 增 大 ， 甚 至 产生 震 功 ， 使 系统 不 能 稳定 工作 。 

玉 . 对 动态 性 的 影响 是 : 天 大， 反应 较 迟 钝 : 玉 。 小 ， 反 应 快 ， 上 升 速率 大 。 而 已. 过 
小 ， 引 起 大 的 超 调 ， 使 调节 时 间 长 ， 闫 重 时 不 能 稳定 工作 。 

2 ) 盛 .下 对 系统 稳定 性 的 影响 

在 异 糊 控制 系统 中 , 一般 不 可 能 消除 稳 态 误 盖 ， 更 不 可 能 消除 误差 变化 率 . 一般 而 言 ， 
总 增加 ， 稳 态 误 差 将 减 小 ， 玉 。 增 大 ， 稳 态 时 误差 变化 率 也 将 减 小 。 然 而 配 ， 玉 .对 动态 
性 能 也 有 影响 ， 因 此 必须 兼顾 两 方面 的 性 能 。 

3) 妃 对 系统 性 能 的 影响 

帮 相 当 于 常规 系统 中 的 比例 增益 ， 它 主要 影响 控制 系统 的 动态 性 能 。 一 般 多 加 大 ， 
上 升 速度 就 快 。 但 于 过 大 ， 将 产生 较 大 的 超 调 ， 严 重 时 会 影响 稳 态 工作 ， 和 一 般 控制 系 
统 不 同 的 是 ， 下 一 般 不 影响 系统 的 稳 态 误 美 。 
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第 9 章 运动 控制 中 的 摩擦 力 补 余 
其 建 模 技 术 


摩 掠 力 最 早 是 上 Da Vinei 于 1519 年 发 现 的 ， 他 认为 ， 摩 掠 力 正比 于 负载 ， 并 与 运动 
方向 相反 ， 且 与 物体 接触 而 积 无 关 。Da Vinei 的 摩擦 力 横 型 是 山 Anmontons 于 1699 年 发 
现 的 。Morin 于 1833 年 引入 了 静 摩 氛 方 的 概念 ， 而 Reynolds 于 1886 年 提出 了 流体 的 粘 
汪 摩 擦 力 ， 从 而 完成 了 最 常用 于 工程 的 摩擦 力 模 型 ， 静 态 + 座 仑 + 粘性 摩 据 力 的 模型 。 

摩擦 存在 于 定位 控制 、 低 速 和 速度 变 向 的 跟踪 系统 中 ,包括 望 远 镜 、 天 线 、 精 密 机 床 、 
磁带 驱动 器 、 机 器 人 和 跟踪 机 械 的 控制 系统 。 摩 控 学 于 20 世纪 30 年 代 诞 生 于 英国 。 近 70 
年 来 ， 众 多 研究 者 的 研究 成 果 也 提供 了 一 系列 的 摩 掠 力 模 型 以 及 对 其 的 补偿 技术 。 人 们 一 
直 认 为 : 摩擦 补偿 器 的 成 功 设计 与 分 析 ， 极 大 地 取 次 于 所 采用 的 摩 氛 横 型 的 精度 以 及 应 用 
的 分 析 技 术 的 合理 性 。 摩 擦 学 研究 者 从 接触 摩擦 学 和 角度， 通过 对 一 致 性 以 及 不 一 致 性 接触 
表面 的 物理 特性 的 研究 ， 分 析 了 刚体 接触 而 的 粗 焙 度 、 接 触 应 力 、 前 切 强 度 、 负 载 变 化 等 
因素 ， 对 摩擦 力 的 影响 作用 ， 相 当 透 彻 地 研究 了 具有 润滑 的 金属 与 金属 表面 的 接触 ， 在 慢 
速 滑动 过 程 中 ， 作 为 速度 通 数 的 摩擦 力 ， 在 摩擦 机 理 上 所 体现 出 来 的 四 个 动 方 学 区 域 ， 并 
道 过 许多 分 析 工 具 诸如 : 描述 纹 数 活 、 相 平面 法、 代数 分 析 法 及 仿真 ， 加 上 细致 周到 的 实 
验 ， 求 出 或 经 验 地 得 到 比较 精确 的 摩擦 力 横 型 。 此 外 ， 机 械 工程 学 者 也 从 不 同 角 度 去 考虑 
具有 摩擦 的 机 器 的 补偿 技术 问题 。 其 中 包括 机 械 学 、 任 务 本 身 、 摩 擦 方 模型 、 分 析 技 术 以 
及 其 他 补偿 技术 ， 其 方法 主要 集中 在 低 摩 控 机 器 的 设计 或 润滑 的 选择 、 带 有 死 区 的 积分 控 
制 、 直 接力 反馈 、 脉 冲 控制 、 库 仑 摩 掠 力 的 前 向 补偿 以 及 取决 于 位 移 的 摩 近 力 的 前 向 补偿 
等 。 

许多 拧 制 领域 的 研究 者 ， 利 用 稳定 性 更 论 、 非 线性 控制 、 非 线性 又 统 辩 识 、 自 适应 控 
人 制 以 及 其 全 手段 ， 对 共有 摩 掠 力 的 机 电 了 又 统 进行 了 不 同方 式 的 控制 。 但 由 于 绝 大 部 分 研究 
者 是 基于 库仑 模型 进行 控制 或 参数 装 识 的 ， 不 符合 实际 存在 的 非 线性 摩擦 模型 ， 因 而 分 析 
工具 和 辨识 工具 所 预测 的 摩擦 力 参 数 以 及 有 关 摩 掠 力行 为 部 是 存在 误 益 的 。 

随 着 电力 电子 学 以 及 计算 机 的 迅猛 发 展 ， 先 进 的 智能 控制 策略 开始 进入 应 用 阶段 ， 这 
为 解决 非 线 性 摩擦 力 影 响 的 问题 开辟 了 新 的 途 行 。 智 能 控制 ， 尤 其 厚 些 不 依 态 于 被 控 对 有 每 
数学 模型 的 先进 控制 ， 对 从 根本 上 消除 难以 精确 建 异 的 以 及 难以 用 量化 控制 方法 解决 的 非 
线性 摩擦 方 的 影响 提供 了 极 大 的 可 能 性 。 采 用 先进 方法 对 非 线性 摩擦 方 进行 辨识 与 在 线 补 
偿 是 一 个 具有 挑战 性 的 课题 。 富 有 更 大 挑战 性 的 是 ;采用 先进 的 不 依 顿 于 系统 模型 的 智能 
控制 策略 来 解决 共有 摩 掠 机 器 的 摔 制 问题 。 只 有 这 样 ， 才 有 订 能 解决 摩擦 方 的 预测 模型 也 
没有 真正 解决 的 问题 。 
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ii 和， 


9.2 摩擦 学 及 实验 上 提出 的 非 线 性 摩擦 力 模型 


考虑 图 9.1 所 示 的 一 个 与 弹 敌 常数 为 大 相连 、 质 量 为 六 的 物体 在 导轨 上 滑动 的 欠 统 。 
特 于 运动 物体 与 导轨 间 的 摩 探 力 是 随 速 度 方向 而 改变 的 ， 汉 速度 ?>D 时 ， 库 仑 摩擦 力 为 
常数 + 六， 而 当 速 度 》<0 时 ， 库 仑 摩擦 力 为 常数 ~- 状 ， 如 图 9.2 所 示 。 根 据 生 顿 定理 ， 
此 系统 的 运动 微分 方程 为 : 
人 二 PH 十 大 切 十 和 (9.1) 
式 中 ，jF 太 是 ?的 非 线性 函数 。 





图 9.1 物体 在 导 扫 上 诊 动 的 示意 图 ”图 9.2 库仑 摩 控 力 
实际 上 上， 当 运 动 速度 很 局 时 ， 摩 控 力 星 碍 出 复杂 的 非 线性 变化 ， 如 图 9.3 所 示 。 如 果 
物体 运动 速度 》 很 小 ， 或 | 让 <  ， 摩 掠 力 星 下 降 特性 ， 即 摩擦 力 具 有 负 阻 尼 欠 数 特性 。 
当 系 统 工作 在 图 9.3 的 阴影 部 分 时 ， 系 统 会 发 生 “ 巾 行 ”现象 。 











图 9.3 摩 妊 力 特性 曲线 
已 有 不 少 基于 实验 的 非 线性 摩擦 为 的 模型 被 研究 者 提出 。 其 中 一 个 有 较 儿 共同 之 处 的 
实验 模型 为 3 


(从 = 已 二 (已 一 已 Je 人 让 十 五 》 (9.2》 


此 处 枣 为 最 大 静摩擦 力 ， 瑟 .为 库仑 摩擦 力 的 最 小 值 ， 不 同 模型 的 差异 表现 在 函数 gt(-) 中 ， 
有 的 测 得 9(] 为 速度 的 函数 ， 有 的 内) 为 时 间 的 缚 数 。 总 之 ， 由 上 式 可 以 看 出 ， 非 线性 摩 
擦 力 与 速度 呈现 近似 的 指数 函数 关系 。 若 把 与 速度 成 正比 关系 的 粘 澡 摩 擦 力 瑟 》 与 线性 
系统 的 传递 函数 化 为 一 体 ， 则 由 前 两 项 所 构成 的 非 线 性 摩擦 力也 是 实际 应 用 中 常 遇 到 的 形 


式 。 
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9.3 机 械 控 制 工程 上 采用 的 分 析 与 补偿 法 


机 械 控制 工程 上 普遍 认为 : 最 有 北 的 消除 定位 或 慢 速 控制 系统 中 的 申 行 方法 是 切断 被 
控 过 程 中 自身 产生 的 自 激 振荡 的 内 反馈 回路 。 一 般 机 械 刚体 (如 机 床 工 作 台 或 其 他 运动 部 
件 ) 在 润 清 不 足 的 导轨 上 运动 时 ， 在 一 定 条 件 下 会 产生 疏 行 或 自 激 振 动 ， 另 外 金属 切削 过 
程 或 液压 系统 中 清 闪 与 管道 系统 都 有 可 能 产生 自 激 振动 问题 ， 这 些 可 以 应 用 控制 理论 中 有 
关 稳 定性 理论 进行 分 析 ， 设 法 切断 内 在 反馈 或 采取 其 他 措施 ， 在 一 定 程度 上 和 神 制 或 控制 这 
种 振动 。 人们 将 经 典 控制 理论 以 及 现代 控制 理论 与 机 械 工 程 科学 技术 有 机 地 结合 在 一 起 ， 
对 非 线性 摩擦 进行 分 析 的 常用 方法 有 措 述 函数 法 及 相 平面 法 。 

了 托 述 函数 法 

描述 函数 法 是 将 线性 系统 理论 中 非常 有 效 的 传递 函数 概念 及 分 析 方 法 加 以 推广 ， 应 用 
来 分 析 非 线性 系统 的 一 种 方法 ， 它 的 定义 为 : 输出 的 一 次 谐 波 分 里 与 输入 正弦 信号 的 复数 
比 。 描 述 函数 法 的 使 用 是 假定 非 线性 系统 满足 下 列 条 件 : 

也 非 线性 系统 是 非 时 变 的 : 

包 任 一 非 线性 系统 均 可 看 成 是 由 线性 部 分 与 非 线性 部 分 所 组 成 ， 如 果 线 性 部 分 具有 低 
通 滤波 的 特性 ， 使 得 高 于 一 次 的 谐 波 均 不 能 通过 ; 

已 输 出 > 中 无 直流 恒定 分 量 。 这 样 ， 利 用 描述 函数 洲 描 述 非 线性 环节 ， 实 际 上 是 使 
系统 线性 化 了 。 

因此 ， 可 将 分 析 线 性 系统 所 用 的 奈 奉 斯 特 稳定 判 据 、 设 计 以 及 校正 方法 等 用 来 对 这 种 
系统 进行 分 析 ， 只 需 此 做 适当 的 修改 即 可 。 由 此 可 见 ， 描 述 函 数 法 是 一 种 有 效 的 线性 化 六 
法 ， 这 种 方法 较 直观 ， 但 是 它 是 一 种 仅 适 用 于 一 定 条 件 下 的 近似 的 方法 。 

利用 描述 函数 法 可 以 从 理论 上 对 运动 机 械 产 生疏 行 和 自 激 振动 的 原因 进行 分 析 ， 并 可 
以 得 出 结论 : 产生 疏 行 和 自 激 振动 现象 的 主要 原因 是 由 于 摩擦 力 在 低速 时 的 负 阻尼 特 性 ， 
它 不 能 以 提高 自 振 频 率 来 进行 消除 。 其 常用 的 消除 办 法 有 : 

局 设法 消除 负 阻尼 区 ,可 在 运动 机 梅 中 增加 一 个 正 阻 庆 , 这 样 从 根本 上 消除 产生 中 行 、 
自 激 振动 的 原因 ; 

地 改变 润滑 状态 ， 使 摩擦 系数 特性 改变 ， 即 采用 防 息 行 润 清油 ， 也 可 以 改善 忠 行 情况 ; 

人 如 果 系 统 已 存在 息 行 ， 也 可 外 加 一 个 高 频率 小 振幅 的 强迫 振动 ， 可 克服 这 种 惧 行 运 
动 ， 此 时 要 求 外 加 强迫 振动 的 频率 高 于 系统 的 自 振 频 率 。 采 用 此 方法 时 要 注意 避免 这 种 强 
迫 振 动产 生 的 影响 。 

急 相 平面 分 析 法 

所 谓 相 平面 分 析 法 ， 就 是 用 几何 作 图 法 来 表示 系统 在 各 个 时 刻 所 处 的 状态 ， 又 可 称 为 
状态 平面 法 。 相 平面 法 古 求 解 微分 方程 的 一 种 图 解 方法 ， 以 两 种 状态 〈 或 两 项 ) 作为 坐标 
构成 一 个 相 平 面 。 在 相 平 面 上 作出 一 族 相 〔 或 状态 ) 轨迹 ， 和 构成 相 平面 图 。 相 平面 图 上 的 
每 一 条 相 轨 迹 表 示 在 一 定 起 始 条 件 下 的 系统 运动 过 程 ， 以 及 状态 〈 或 项 ) 的 变化 过 程 ， 从 
而 可 以 得 到 系统 的 动态 特性 。 

利用 相 平 面 法 能 定性 地 说 明 由 行 现象 发 生 的 条 件 ， 为 选择 合适 的 参数 提供 定量 分 析 的 
依据 。 用 相 平面 法 分 析 二 阶 系统 是 非常 有 力 的 。 对 于 高 于 三 阶 的 系统 ， 要 作出 多 维 相 空 间 
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的 图 是 不 可 能 的 ， 即 使 对 于 三 阶 系统 要 作出 三 维 相 空 间 图 形 ， 也 是 极为 困难 ， 所 以 一 般 仅 
用 于 分 析 二 阶 系统 。 
一 般 形 式 的 二 阶 非 线性 微分 方程 为 : 





无 十 了 人 (x,) 广 十 由 (一 (9.3) 
令 
2 一 于 
3 二 关 三 郊 
即 
加 -=x 
dt 
dr ，、， 。 ， - 
了 一 革 = 一 了 (7 语 ) 充 一 由 (天 ) 二 一 (0 大 ) 十 由 (无 ) 2 
所 以 有 : 
dr Cn 722)Xa2 十 内 Ca 3 
di 2 
写成 如 下 更 普遍 的 形式 : 
全 = Po 下 = 00nz) 
即 
ds Pt 和) 
do Ca) 
解 出 上 式 ， 便 吾 得 到 相 轨 迹 的 解析 表达 式 : 
2 二 人 艰 ( 和 ) (9.4) 


将 此 相 轨 迹 画 在 相 平面 中 ， 便 构成 相 平 面 图 。 
对 于 图 9. 1 中 所 示 具 有 库仑 摩擦 力 的 机 械 系统 ， 此 系统 的 运动 方程 式 为 : 


1 十 y 十 五.SEn = (9.5) 
取 辣 =y， 思 =》 为 状态 变量 ， 则 它 的 状态 方程 为 : 
加 二 2 二 了 
。 Kx 十 SS (9.9) 
-3 二 一 -一 ”一 -一 一 
7 


根据 摩擦 力 的 非 线性 特性 ， 可 将 相 平面 分 成 两 个 区 域 ， 一 是 如 =y>0; 一 是 

妇 二 》<D0。 汝 加 之 曲 时 ， 由 【 昌 .) 式 得 : 
dr， Ke 十 天 
dr pt 


解 出 上 式 并 注意 到 为 = 了 ， 六 = 光 ， 可 得 到 相 轨 迹 方 程 为 ; 


。 五 
到 订 +OT+ 下 =R (9.8) 
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式 中 ， 玉 为 常数 ， 由 初始 状态 决定 。 
如 以 | 亚 》 及 》 为 胡 标 输 ，(9.8) 式 是 以 【~ 上 ，0 》 为 圆心 的 同心 国 族 ， 这 便 忆 


上 半 平 面 《y>0) 的 相 平面 图 。 
同 理 ， 在 》<0 时 ， 即 下 半 平 而 的 相 轨迹 方程 为 ; 


更 .人 下 2 
十 fy 一 一 ”一 只 《9.9 1) 
q2 了 了) 十 (7 ) 


赂 9. 4 是 根据 〔9.8) 式 及 (9.9) 式 所 作 的 相 平 面 图 。 
如 细 9.4 中 的 起 始 条 件 已 知 ， 当 起 始点 为 4 点 时 ， 系 统 的 状态 将 沿 荐 相 轨迹 467《〈 半 
圆 ) 变化 。 然 后 再 沿 着 土 半 乎 面 的 相 轨 迹 工大 〈 半 圆 ) 变化 。 当 到 达 z= 了 =0 以 及 


al< 坟 时 ， 系统 在 玉 点 停止 。 
由 此 可 见 ， 非 线性 系统 的 静止 位 置 是 一 个 区 域 ， 并 与 起 始 值 有 关 。 由 图 9.4 可 看 出 ， 
系统 是 稳定 的 ， 它 的 最 大 区 态 误差 为 二 。 





图 9. 4 系统 状态 的 相 平 面 轨迹 图 


9.4 运动 控制 


运动 控制 Hotion Contro1 主要 包括 以 电机 作为 动力 源 的 电气 运动 控制 ， 以 气体 和 流 
体 作 为 动力 源 的 电气 控制 ， 以 的 料 作为 动力 源 的 热机 运动 控制 等 等 。 随 着 微 电 子 技术 和 电 
力 电 子 技术 以 及 计算 机 先进 控制 技术 的 发 展 ， 电 气 送 动 控 制 技 术 显 示 田 无 可 比拟 的 优越 
性 ， 从 而 导致 运动 控制 的 主流 是 电 乞 运动 控制 技术 ， 出 现 了 电 液 、 电 气 电 热 、 机 算 运 动 控 
制 技术 。 可 以 说 运动 控制 是 在 电 驱动 技术 研究 的 基础 上 ， 随 着 科学 技术 的 发 展 而 形成 的 一 
门 综合 性 、 多 学 科 的 训 叉 技术 。 几 十 年 米 ， 大 们 不 断 地 从 电力 电子 技术 、 电 机 技术 、 机 械 
减 摩 技术 以 及 先进 控制 策略 等 方面 不 断 她 寻求 新 的 技术 ， 以 寻求 达到 减少 执行 机 构 的 体 
积 ， 减 少 能 量 损耗 ， 改 善 被 控 系 统 的 稳 态 精度 和 动态 特性 ， 提 高 控制 性 能 的 目的 。 尤 其 是 
20 世纪 90 年 代 以 来 ， 不 少 研究 成 果 已 刊登 在 有 关 自 动 控 制 、 机 器 大 以 及 功率 电子 学 等 会 
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议 与 杂志 上 ， 由 IEEE、IJFAC 分 别 在 日 本 、 意 大 利 、 德 国 和 法 国 等 国 召开 的 专题 为 “先进 
运动 控制 内 “智能 自动 化 运动 控制 ”和 “运动 控制 ”的 国际 会 议 每 年 至 少 一 次 ， 使 得 运动 
控制 在 国际 上 逐步 成 为 一 个 新 的 研究 热点 。 

运动 控制 高 性 能 的 获得 ， 主 要 总 通过 对 执行 机 构 、 浏 量 装 置 和 控制 策略 特性 的 选择 以 
及 对 控制 策略 的 设计 来 达到 的 。 由 于 摩擦 力 具 有 多 变量 、 非 线性 的 依赖 关系 ， 不 同 工 下 
有 不 同 表 现形 式 ， 相 关 的 多 种 机 理 的 共同 作用 以 及 运动 物体 自身 固有 的 特性 等 原因 ， 要 得 
到 普 适 的 摩擦 力 精确 模型 极为 困难 。 智 能 仪器 和 新 的 执行 机 构 儿 是 为 了 简化 机 械 运 动 控 制 
的 实施 装置 ， 只 有 新 的 先进 控制 策略 的 设计 和 应 用 ， 是 以 消除 非 线 性 影响 和 提高 控制 性 能 
为 主要 日 的 的 。 从 目前 的 研究 铺 况 看 ， 运 动 控制 中 先进 控制 策略 的 研究 主要 集中 在 非 模 型 
摩擦 力 补 偿 的 方式 上 ， 采 用 如 模 类 控制 、 变 结构 控制 、 神 经 网 络 控制 、 重 复 控制 以 及 模糊 
和 神经 网 络 相 结 合 等 先进 控制 策略 。 随 着 快速 电力 电子 学 器 件 、 新 型 执行 机 构 的 不 断 涌现 
和 采用 ， 各 种 控制 方法 的 相互 结 侣 以 及 更 加 先进 控制 策略 的 应 用 ， 必 将 使 运动 控制 朝 着 快 
速 性 、 精 确 性 和 答 棒 性 的 高 性 能 方向 发 展 。 


9.5 运动 控制 中 库 仓 摩擦 力 的 结构 分 析 


在 运动 控制 的 实际 应 用 中 ， 经 常 遇 到 诸如 机 器 人 、 机 床 、 无 线 电 天 线 和 天 文 望 远 镜 等 
运动 系统 的 速度 或 位 置 的 控制 。 在 其 工作 过 程 中 存在 着 静 、 动 摩擦 力 、 粘 摩 氛 力 以 及 执行 
机 构 饱 和 等 非 线 性 特性 的 影响 。 当 系统 的 工作 点 落 在 被 控 过 程 输入 /输出 特性 的 线 性 范 畏 
内 时 ， 可 根据 线性 控制 理论 设计 出 适当 的 比例 + 微分 + 积分 (PID) 型 的 控制 蜂 ， 以 满足 期 望 
的 性 能 指标 。 然 而 实际 上 ， 我 们 常 党 会 发 现 ， 金 属 切 削 机 床 微 量 进 给 机 构 在 进 给 速度 很 慢 
时 会 发 生 朴 行 和 自 激 振动 ， 电机 在 低速 度 或 变 向 运动 时 ， 共 输入 /输出 特性 曲线 上 出 现 死 
区 等 ， 这 些 对 于 有 高 跟踪 精度 和 运动 绊 稳 性 要 求 的 运动 控制 系统 米 说 ， 带 来 了 控制 上 一 定 
的 困难 ， 困 为 采用 单纯 的 PID 型 控制 器 ， 其 参数 在 稳 态 误差 与 运动 平稳 性 的 兼顾 上 是 有 
矛盾 的 。 机 械 控制 工程 上 普遍 认 为 最 有 效 地 消除 定位 或 变速 控制 系统 中 的 礁 行 与 自 激 振荡 
的 方法 是 切断 被 控 过 程 中 自身 产生 的 自 激 振荡 的 内 反馈 回路 ， 主 要 考虑 通过 低 摩 所 机 器 的 
设计 、 泣 滑 的 选择 以 及 利用 并 述 函 数 或 人 平 面 法 对 系统 稳定 性 的 分 析 而 选择 使 系统 稳定 的 
机 械 系 统 的 参数 。 控 制 工 程 的 设计 则 主要 是 基于 摩擦 力 模型 的 补偿 技术 。 在 系统 稳定 的 前 
担 下 ， 从 误差 和 半 稳 性 的 综合 角度 去 考虑 问题 ， 采 用 自 适 应 控制 策略 去 补偿 时 变 的 非 线性 
摩擦 力 。 

本 节 对 机 电 执行 机 构 中 存在 的 各 种 摩擦 力 进 行 分 析 ， 分 析 库 仑 摩 氛 力 在 二 阶 系统 中 对 
不 同形 式 的 线性 补偿 器 所 产生 的 稳 态 误差 ， 并 指出 其 减少 和 消除 的 途径 。 指 出 直接 的 力 抵 
前 向 补偿 法 是 最 有 效 的 消除 摩擦 力 的 方法 ， 提 出 一 种 非 线 性 摩擦 力 模型 与 其 参数 确定 的 实 
验 室 方法 ， 最 后 给 出 采用 自 适应 参数 辨识 法 直接 对 库仑 常数 摩擦 力 值 的 辨识 公式 。 

在 机 电工 程 中 ， 以 直流 电机 为 例 ， 其 机 电动 态 特性 的 运动 可 用 下 列 微分 方程 描述 : 


了 = .+B58+7r (9.10) 


其 中 4 为 钊 位 移 输出 ,了 为 总 惯量 , 中 为 粘 摩 擦 系数 , 7 为 控制 输入 力 拖 , 7 为 静 动 摩擦 力矩 。 
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从 所 周知 , 机 电 系 统 中 的 摩擦 力 是 由 静摩擦 廊 、 库 仑 摩 探 力 和 粘 摩 掠 力 组 合 而 成 的 ( 见 
图 9.5)， 因 为 粘 摩 氛 力 是 与 系统 的 速度 成 正比 的 ， 是 速度 的 线性 函数 ， 大 们 常常 把 它 与 钱 
性 系统 的 建 模 化 为 一 体 ， 成 为 线性 系统 的 一 部 分 。 而 分 离 出 粘 摩 拟 力 后 的 静 动 摩擦 力 好 ， 
是 我 们 常常 研究 的 对 象 。 静 摩擦 万 仅 存 在 于 种 =0 时 纠 ， 且 它 的 幅 值 总 是 大 十 库仑 摩擦 力 。 
一 旦 86z0， 就 只 有 库仑 摩擦 方 作 用 于 执行 机 构 ， 其 值 为 一 常数 民 ， 作 用 力 的 方向 总 是 
与 运动 方向 相反 。 当 工作 点 落 入 线性 区 时 ， 有 下 式 成 立 : 

7 = 和 sgnlg) (9.11) 

其 中 ，sgn() 为 符号 函数 。 车 设 控制 器 的 传递 函数 为 Ce fs] ， 则 具有 于 扰 了 7 的 负 反 馈 控 制 
系统 的 结构 图 如 图 9.6 所 示 。 











图 9.5 非 线性 摩擦 力 模型 图 9.6 具有 7 的 名 反锁 控制 系统 的 结构 疼 
允 于 EID 敢 补 偿 器 结构 ， 我 们 通过 令 参考 输入 br =0, 分 析 仅 由 Try 单独 作用 时 ， 在 
不 同 补偿 器 结构 的 作用 下 ， 系 统 的 稳 态 误 竹 e。 的 值 米 看 其 补偿 效果 。 为 了 分 析 简 便 ， 对 
Jr 仅 考虑 库仑 摩擦 力 五 的 影响 。 当 补偿 器 仅 为 比例 项 ， 即 Cefs)= 天 时， 输入 7 (中 与 


输出 Bf 之 间 的 传递 函数 为 : 
Gs) 1 


Tr(D .9 十 B5+ 天 站 
此 时 ， 和 7 fs) 与 误差 Bfs) 之 间 的 传递 函数 可 以 写 为 ; 
EGG) ec 1 
TrG) FTrt) .15 十 如 3 十 开间 
由 终 值 定理 可 以 求 得 由 (9.11) 式 确定 的 库仑 摩 控 力 所 产生 的 稳 态 误差 为 : 


ce = limsE( 




















_ 士 
-=lim_ -7 .十 (9.127 
0 .十 再 5 十 天。 了 
。 
-一 - 当 B>D 
了 五 
三 十 王 六 
玉 。 + 一 -当日 <0 
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此 时 补偿 器 的 控制 输出 为 :Te = 天 pe = 于 Te 。 


由 此 可 以 看 出 ， 稳 态 时 ， 比 例 补 偿 器 提供 的 拧 制 力矩 为 于 宛 ， 其 幅 值 与 于 拢 摩擦 力 
矩 相同 ， 方 向 相反 ， 以 此 来 将 其 抵消 。 系 统 在 六 的 作用 下 的 稳 态 输出 为 : 
8 =-e- = 二 fy KE ， 即 比例 补偿 器 Gef9)= 天 ， 将 干扰 值 减 少 了 ULR 。 这 也 正 是 负 反 馈 
作用 的 结果 :， 降低 了 于 挑 的 影响 ， 但 没有 完全 将 其 消除 。 由 《9. 12) 式 可 以 看 出 ， 可 以 通 
过 加 大 比例 常数 天 的 值 米 减 少 系统 的 稳 态 误 莽 ， 然 而 ， 增 加 尼 。 的 同时 ， 也 增 大 了 系统 
响应 的 波动 性 。 

虽然 在 比例 补偿 器 的 作用 下 ， 只 要 大 >0， 闭 环 系统 为 二 阶 稳 态 系统 ， 但 随 着 玉 的 增 
加 ， 所 产生 系统 响应 的 误差 与 波动 并 不 是 我 们 所 期 望 的 ， 所 以 仅 用 比例 补偿 器 来 消除 位 置 
控制 系统 中 的 库仑 摩擦 力 的 影响 是 不 够 理想 的 。 可 以 用 以 改进 的 办 法 之 一 是 采用 比例 加 积 
分 的 FI 补偿 器 。 此 时， 比例 控制 作用 趋向 于 稳定 系统 ， 而 积分 控制 作用 趋向 于 减少 对 不 


闻 输 入 响应 的 稳 态 误差。 只 要 系统 中 存在 误差 信和 号， 补偿 器 就 产生 一 个 将 其 减少 的 力矩 ， 
且 同 时 使 系统 稳定 。 


采用 与 上 面 朵 样 的 分 析 方 式 对 Gs(9= 才 (1+1/3s) 时 控制 系统 的 稳 术 误差 进行 分 





析 。 当 98 =0 时 ， 只 要 控制 系统 特征 方程 .> + Bs“ + 天 ps+ 开 717; =0 的 根 具有 负 实 部 ， 





由 终 值 定理 可 以 求 得 对 于 幅 值 为 到 | 的 库仑 摩擦 方 矩 二 扰 的 稳定 系统 的 移 术 误差 为 : 


e_ 一 lm 59) 
3 一 站 
= lim 一 -- 呈 (9.13) 
一 0 3 5 玫 p 
站- 十 呈 9? 一 十 二 下 了 十 一 一 
万 





一 履 
由 此 可 见 ， 采 用 PI 补偿 器 ， 可 以 将 控制 系统 中 的 库仑 摩擦 力 完全 消除 。 但 是 值得 注 


意 的 是 ， 由 于 在 比例 器 中 加 入 了 积分 器 ， 使 原先 的 二 阶 系统 变 为 三 阶 系统 ， 所 以 当 K 取 
值 较 大 时 ， 有 下 能 使 用 环 系统 的 特征 多 项 式 的 根 变 为 正 实 部 而 造成 系统 的 不 稳定 。 所 以 对 
玫 p 的 选 值 要 如 以 限制 。 另 外 ， 如 果 只 采用 单独 的 积分 器 Gefsj)= 到 。 7 作为 补偿 器 ， 系 统 


将 变 为 不 稳定 系统 。 因 为 此 时 闭环 系统 的 特征 多 项 式 变 成 了 3 +Kps2+K， =0， 总 存在 


正 实 部 的 根 。 这 样 的 不 稳定 的 系统 在 实际 中 是 不 能 使 用 的 。 
如 果 在 比例 器 的 基础 上 加 微分 器 ， 可 以 使 得 补偿 器 具有 更 高 的 灵敏 度 。 微 分 器 一 方面 
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对 误差 的 变化 率 给 予 响应 ， 且 能 够 在 误差 的 幅 值 变 大 之 前 产生 一 个 校正 量 ， 从 而 预计 误差 
便 ， 提 前 给 予 一 个 校正 值 ， 并 能 够 增加 系统 的 稳定 性 ， 另 一 上 方面， 虽然 微 分 控制 不 直接 对 
稳 态 误差 有 影响 ， 它 可 以 增加 系统 揭 阻 尼 ， 从 而 允许 使 用 较 大 的 放大 增益 态 而 间接 地 改 
善 系统 的 稳 态 精度 。 所 以 对 于 位 置 控制 系统 来 说 ， 如 果 不 要 求 稳 态 误差 一 定 为 堆 ， 则 可 以 
使 用 PD 补偿 器 ， 这 样 可 以 使 用 较 大 的 筷 ， 同 时 因 被 控 系 统 为 正 系数 的 二 阶 系统 而 总 契税 
定 的 。 


9.6 基于 模型 的 摩擦 力 前 向 补偿 器 的 设计 


上 节 分 析 了 不 同类 型 的 补偿 器 对 常数 库 1 _ - 和 
仑 摩擦 力 的 补偿 作用 ， 这 足 通 过 闭环 负 反 馈 
补偿 器 对 干扰 进行 补偿 与 消除 的 技术 。 实 际 
上 ， 对 库仑 摩 氛 力 的 最 有 效 的 补偿 方法 应 当 
是 直接 力矩 的 前 向 补偿 法 。 只 要 能 够 预测 出 
干 挑 的 数值 ， 即 订 在 前 向 回路 中 的 正常 控制 
量 上 加 上 一 个 与 干扰 同 值 但 符号 相反 的 作用 加 
将 其 抵消 ， 从 而 使 干扰 的 作用 在 被 传感器 感  “” 1 为 拭 ( 任 顿 特 
应 并 放大 之 前 就 将 其 消除 。 图 9.7 直流 电视 亚太 力矩- 一 速度 特性 翰 线 
运用 前 向 补偿 的 关键 在 于 对 摩擦 力矩 的 合理 估 和 值 。 对 于 仅 采 用 库仑 摩擦 力作 为 模型 的 
估 值 ， 可 以 通过 下 述 实 验 进行 。 向 被 控 过 程 输入 初始 值 为 零 、 斜 率 为 正 的 斜 破 信 号 ， 并 测 
量 过 程 速度 输 呈 的 响应 。 由 此 得 到 其 “ 力 抵 一 速度 ”的 输入 /输出 的 静态 特性 曲线 如 图 9.7 


所 示 ， 堪 的 值 是 通过 当 速 度 由 反 向 正 斜 率 斜 坡 信 和 号 上 升 ， 变 为 -6 =0 时 力矩 揭 输 入 值 来 











电 抽 速度 (1000 转 /分 ) 























确定 的 。 此 值 所 对 应 的 输入 力矩 即 为 库仑 摩 氛 力 矩 的 估计 值 全 。 





图 9.8 静 、 动 摩擦 力 模型 
实际 上 ， 采 用 不 同 斜 率 的 斜坡 输入 所 得 到 的 多 不 尽 相同 ， 这 亲 以 由 图 9.8 来 解 友 ， 表 


摩擦 力矩 虽然 仅 存在 于 9 =0 时 刻 ， 在 由 零 变 为 非 零 的 暂 短 的 时 间 中 ， 静 摩擦 力 矩 不 订 
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能 立刻 降 为 堆 ， 而 是 有 一 个 降 至 零 的 过 渡 过 程 。 这 个 过 湾 过 程 的 快慢 程度 与 速度 成 近似 的 
指数 关系 。 所 以 输入 对 应 于 不 同 的 斜率 的 斜坡 ， 得 到 克服 静摩擦 力 而 使 执行 机 构 开 始 运动 
的 时 间 长 短 不 同 。 斜 率 大 的 较 早 地 达到 稳 态 库仑 摩 擅 力 常 值 。 所 以 此 法 只 能 测 出 开 的 一 
个 估计 值 系 ， 估 值 误差 只 能 通过 闭环 控制 器 进一步 加 以 消除 。 


出 图 9. 8 可 以 看 出 ， 更 人 台 理 的 摩 氛 力 模型 应 同时 考虑 静 、 动 摩擦 力 影响 的 非 线 性 摩 近 
力 模型 。 一 个 与 速度 成 指数 关系 的 摩擦 力 模型 可 以 为 : 


7 = 开 上 (人 人)e (9.14) 

模型 中 的 为 静摩擦 力矩 ，c 为 时 间 常 数 ， 且 根据 具体 被 控 过 程 由 实验 确定 。 歼 是 
利用 图 9. ? 中 静态 力矩 一 速度 特性 曲线 ， 使 输出 从 零 转 为 大 于 等 时 的 输入 值 来 确定 的 。 值 
得 注意 的 是 ， 利 用 此 非 线性 模型 进行 补偿 时 ， 它 仅 需 应 用 于 便 >0 段 ， 即 正 、 反 向 加 速 段 ， 
在 创 <0 段 的 摩擦 力 补偿 仍 大 采用 (9. 11) 式 。 采 用 《9. 14) 式 模型 补偿 的 效果 显然 优 于 


(9. 11) 式 的 效果 。 进 行 非 线性 摩擦 力 的 补偿 以 及 系统 的 控制 规律 可 以 通过 比如 数字 信和 号 处 
理 器 的 控制 系统 来 实现 。 





9.7 线性 模型 的 参数 准 识 


人 欢 所 丑 知 , 经 典 控制 理论 的 实际 应 用 是 基于 被 控 对 象 的 数学 模型 。 然 而 在 许多 情况 下 ， 
被 控 对 象 的 数学 模型 很 难 精确 获得 ， 或 者 对 象 模型 的 参数 在 工作 过 程 中 随时 间 发 生变 化 ， 
另外 出 于 系统 仿真 的 需要 ， 使 系统 模型 的 建立 和 系统 参数 的 辨识 常常 成 为 能 否 成 功 地 应 用 
控制 理论 的 关键 之 一 。 它 的 实际 应 用 已 遍及 各 个 领域 。 本 节 首先 给 出 对 人 们 在 实际 中 常用 
的 各 种 不 同 的 模型 的 结构 及 其 功能 ， 并 与 控制 界 常用 的 MATLAB 环境 下 条 统 因 识 工具 箱 
中 所 采用 的 模型 相 比 较 ， 指 出 各 自 的 特点 ， 最 后 给 出 常数 库仑 摩擦 力 的 辩 识 方法 。 

所 谓 的 线性 模型 的 “ 辨 识 ” 就 是 在 所 测 取 的 输入 和 输出 数据 的 基础 上 ， 从 一 组 给 定 的 
模型 中 ， 确 定 一 个 与 所 测 系统 等 人 的 模型 。 辨 识 过 程 把 待 辨识 过 程 看 作 是 一 个 “ 墨 箱 ”， 
它 只 考虑 过 程 的 输入 /输出 特性 ， 而 不 强调 过 程 的 内 部 机 理 。 系 统 辨 识 的 方法 有 许多 种 ， 
可 以 有 各 种 不 同 的 分 类 法 。 着 根据 所 涉及 的 模型 形式 ， 辨 识 的 方法 可 分 为 非 参 数 模 型 辨识 
和 参数 模型 辨识 两 种 ， 匣 根 据 计 算 机 与 系统 之 问 的 不 同 连接 方式 ， 因 识 的 方法 又 可 分 为 在 
线 辩 识 和 离线 准 识 ， 如 果 根 据 不 同 的 辨 识 基本 原理 ， 常 用 的 参数 模型 辨识 方法 又 可 分 为 三 
种 :最 小 二 乘法 、 梯 度 校 正法 和 极 大 似 然 法 。 


9. 7.1 基于 不 同 原理 的 辨识 方法 


对 于 待 因 识 过 程 ， 其 输入 xi) 和 输出 Y(f) 是 可 以 观测 的 ， 通 常 找 述 过 程 输入 /输出 特 


人 


-1 
性 的 模型 C(z-1 可 以 表示 成 5 和 ， 其 中 
忌 


MKzrHD=1+ az 十 E2 2 十. Co Za 





(2 = 六 2 522 十 二 pos 
过 程 的 输出 除了 受 输 入 ME) 作用 之 外 ， 往 往 还 受到 其 他 一 些 不 傅 定 因素 的 影响 ， 通 
本 且 均 值 为 
零 、 谱 密度 是 cos 外 的 有 理 玫 数 时 ， 开 各 交 人 本本 用人 人 NGzDv(D， 其 中 ，vw) 为 白 


吵 产 ; NM(z-1 是 噪声 模型 ， 着 各 可 玫 示 成 Ne-D= CC ，a 式 中 : 
忆 


Clz -=1+clz-1 二 coz2 十 十 Ci 本 
D(z -1)=I+d1z 十 d22 十 十 2 


在 传统 的 辨识 方法 中 。 常 用 的 基于 差分 方程 的 参数 模型 辩 识 有 以 下 几 种 。 
1) 最 小 二 乘 类 算法 
最 小 二 乘 类 参数 辨识 方法 ， 包 括 最 小 二 乘法 、 增 广 最 小 一 乘法、 广义 最 小 二 乘法 、 畏 
助 变量 法 等 ， 其 辨识 方法 就 其 原理 来 觉 是 相同 的 ， 只 是 各 种 方法 所 用 的 模型 结构 不 一 样 。 
例如 ; 
最 小 二 乘法 所 用 模型 是 : 
4(z TD)y(C6= BCz Da( 乓 十 RD (9.15) 
增 广 最 小 二 乘法 所 用 模型 是 ， 
MA(z TD)y( 间 = 有 za 的 +C(zLDvC (9.16) 
广义 最 小 二 乘法 所 用 模型 是 : 





4CTD7D= BCGzDuD+- 一 0 (9.7) 
DC 


等 等 。 可 见 不 论 采用 什么 样 的 辨 识 方法 ， 所 用 的 过 程 模型 总 是 一 样 的 ， 只 是 噪声 模型 有 所 
不 同 。 

最 小 二 乘法 是 最 基本 的 ， 也 是 应 用 最 广泛 的 一 各 方法。 上面 所 提 的 其 他 方法 都 是 以 最 
小 二 悉 原 理 为 基础 的 。 最 小 二 乘法 大 约 是 1795 年 商 斯 在 他 的 著名 的 星体 预报 研究 中 提出 
的 。 由 于 最 小 二 乘法 严密 简单 ， 纲 程 容易 ， 成 为 估计 理论 的 芮 基 右 ， 得 到 广泛 的 应 用 。 最 
小 二 乘法 的 基本 结果 有 两 种 形式 ， 一 种 是 经 典 的 一 次 完成 算法 ， 另 一 种 是 递 推 算法 。 后 者 
常 使 用 于 计算 机 在 线 准 识 。 

2 ) 最 小 二 乘法 的 解 

设 过 程 的 输入 /输出 关系 可 以 撒 述 成 如 下 的 最 小 一 乘 形式 ， 

了 各 = 和 (BAY (9.18) 

其 中 ，Y(k) 为 白 噪 声 ，g) 为 可 观测 的 数据 序列 ，8 为 被 估计 参数 序列 ， 分 别 表示 为 ， 
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| 三 伍 区 估 一 下 一 了 一 下 本 下 有 


日 王 [Gd 
最 小 二 乘 算 法 的 原理 就 是 根据 数据 序列 {yj 和 fb( 昌 } ， 极 小 化 下 列 准 则 函数 ， 
了 
J 乓 = 误 [y(D 一 加 (061 (9.19) 
年 一 ] 


使 6) 为 要 小 时 的 8 佑 计 值 记 作 号 ， 并 被 称 为 参数 8 的 最 小 二 索 估 计 。 

上 述 过 程 表 明 ， 未 知 模型 参数 最 可 能 的 值 是 在 实际 观测 值 与 计算 值 之 问 黑 次 误差 的 
平方 和 达到 最 小 值 处 。 

标准 最 小 二 冬 问 题 的 解 为 


旧 = (中 )-dy {9.20) 
最 小 二 乘 递 推算 法 为 : 
EC =EE 一 D+ 天 OOEYO 一 办 (OBE- 切 


下 (= 巨 一 DB (CIP( 开 一 DB( 天 二 和 二 
PE) 三 [一 站 伏 ) 各 (PK 一 了 


3 ) 增 广 聂 小 二 蓝 法 的 解 
增 广 最 小 二 乘法 是 最 小 二 蒋 法 的 一 种 简单 推广 ， 它 把 噪声 模型 的 辨识 在 模型 中 同时 进 
行 考虑 。 增 广 最 小 二 乘法 的 解法 与 最 小 二 过 法 的 解法 基本 相同 ， 过 程 的 输入 /输出 关系 同 
样 可 以 描述 为 《9.16) 式 所 表现 的 最 小 二 乘 形式 。 其 中 ; 
纵 类) = [了 ( 开 一 要 一 二 一 各 三 (起 一 二， 
一 下 才 一 中 Y 玫 一 有 一 人 伏 一 中- 证 


上 日 王 [alias 人 


二 
He 
内 (和 中 包含 不 可 测量 噪声 -0D…-v 才 -ne)， 可 按 下 式 求 得 相应 的 估计 值 代替， 
识 抽 = 站 天 忌 们 
六 有 间 = (后 - 和 (DGK-D 天 >0 


号 sl 


4 ) 广义 最 小 二 法 
广义 最 小 二 乘法 的 基本 思想 是 对 输入 /输出 数据 先进 行 一 次 滤波 处 理 ， 然 后 刊 用 普通 
最 小 二 乘法 对 凄 波 后 的 数据 进行 辨识 ， 模 型 如 〔9.17) 式 所 示 。 由 于 其 中 的 噪声 模型 
Ptz-1 未 知 ， 所 以 需要 首先 利用 最 小 二 乘法 获得 D(z-1 中 参数 的 估计 。 然 后 令 ， 
yF( 操 = D(z TD)y(E) 
ur (了 轴 = D(z Du 


则 人 (9.17) 式 转化 为 标准 的 最 小 二 乘 形式 (9.15) 式 。 

(1 ) 辅助 变量 法 

辅助 变量 法 的 基本 思想 是 适当 地 选 耕 辅助 变量 ， 使 之 满足 一 定 的 条 件 ， 以 获得 参数 的 
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id 


无 偏 一 致 估计 。 
A(z-D3yGE)= BCzTDeeD+ed) 《9.21) 


其 中 ，e(k) 为 有 色 噪 声 。 

由 于 e( 旭 为 有 色 了 噪声 ， 直 接 利用 最 小 二 乘法 不 能 获得 参数 的 无 储 一 致 佑 计 ， 所 以 需要 
先 利用 辅助 变量 将 〈9.21) 式 转 换 成 前 面 已 经 介绍 过 的 易 求 解 的 形式 ， 然 后 利用 最 小 二 乘 
法 进行 参数 估计 。 

(2)》 梯度 下 降 法 

梯度 下 降 法 利用 最 速 下 降 法 的 原理 ， 沿 着 误差 准则 斑 数 关于 模型 参数 的 负 梯度 方向 ， 
逐步 修改 模型 的 参数 估计 值 ， 直 至 误差 准则 函数 达到 最 小 值 。 


7 = 有 (做 间 (9.22) 
迭代 公式 为 : 
BE+TD=E+RODOCD[Iy( 拉 一 gr(6GCOD] 


其 中 ， Rb) 为 权 和 矩阵 ， 其 作用 是 用 来 控制 各 输入 分 量 对 各 权 估 计 值 的 影响 程度 。 

采用 梯度 下 降 法 进行 参数 估计 的 原理 完全 不 同 于 最 小 二 匀 法 ， 它 的 特点 是 计算 简单 ， 
可 以 用 于 在 线 的 实时 辨识 。 

(31) 极 太 似 然 法 

极 大 似 然 法 是 根据 极 大 似 然 原 理 ， 通 过 极 大 化 亿 然 函数 来 确定 模型 的 参数 。 


Atz -DR BCzDakt+C(zDv(E) (9.23) 


极 大 似 然 法 的 基本 加 想 是 构造 一 个 以 数据 和 未 知 参数 为 自 变 量 的 似 然 范 数 ， 并 通过 极 
大 化 这 个 似 然 函数 ， 获 得 参数 的 估计 值 。 极 大 似 然 法 通常 要 求 具有 能 够 写 出 输出 量 的 条 件 
概率 密度 函数 的 先 验 知识 ， 因 而 ， 极 大 似 然 法 的 计算 量 比较 大 。 而 前 面 介绍 的 两 种 方法 ， 
最 小 二 乘法 与 梯度 下 降 法 不 仅 计算 简单 ， 而 且 具 有 良好 的 无 偏 性 和 一 致 性 ， 对 噪声 特性 的 
先 验 知识 要 求 也 不 商 。 


9. 7.2 MATLAB 中 系统 模型 辨识 的 描述 方法 


与 根据 算法 原理 分 类 不 同 ， 控 制 界 中 常用 的 MATLAB 环 境 下 系统 辩 识 工具 箱 中 的 模型 是 
根据 不 同 的 模型 结构 来 进行 分 类 的 。 
1) 自 加 归 横 型 结构 【由 X Structure )》 
ADID= BAG 一 瑟 )+e) (9.24》 
其 中 : 


名 =1+ag LTaag 2 二 二 Ga 
如 (人 = 入 上 8 主权 9 十 .…， 二 692+1 
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注意 ， 在 怖 TLAB 中 ， 符 号 e 人 被 用 来 表示 和 白 咯 声 。 显 然 ， 这 一 模型 与 标准 的 最 小 二 乘 
模型 (9. 15) 式 完全 一 致 。 其 求解 方法 在 MaTLAB 中 ， 求 解 线性 方程 组 的 算 符 “\” 可 以 直 
接 给 出 参数 的 最 小 二 乘 估计 。 

2)] 自 回归 滑动 平均 模型 寻 构 【ARMAX Structure ) 

AI3Jy 的 = 吾 (GG 一 三 +CI3JeE 人 人 《9.25 ) 
其 中 ， Cg)=1+clg-1+ezg 一 + +cencgae 。 这 一 模型 与 增 广 最 小 二 乘 模型 (9.14》 式 完 
全 一 致 。 

在 MATLAB 系 统 辩 识 工具 箱 中 ， 是 通过 采用 6auss-Newton 搜索 算法 最 小 化 误差 准则 函 
煞 来 获得 参数 估计 的 。 其 做 法 是 在 Gauss-Newton 方 向 上 用 二 分 法 搜索 1 0 次 ， 直 到 找到 一 
个 更 小 的 误差 ， 否则， 转 到 梯度 方向 搜索 来 获得 喝 小 误差 。 

3) 输出 误 关 结构 (Output-BError Structure ) 


二 Jo- ze (9.26) 








3 = 


其 中 ， Ruessspe 

此 算法 基本 上 和 ARMAX Structure 相 同 ， 也 只 是 误差 准则 与 梯度 的 计算 略 有 不 同 。 

4)] Box-Jenkins 模型 结构 (Bo0r 一 7enkrns Structure1 
如 (9 um 上 全 

天 (人 P(9) 

其 中 ，D(9)=1+adT1+dog2+Heo9T。 

不 难看 出 ， 这 是 一 种 最 一 般 的 结构 ， 前 三 种 结 椅 都 是 它 的 特例 。 此 模型 算法 基本 上 和 
48UW4Y Structure 相 同 ， 只 是 误差 准则 与 梯度 的 计算 上 有 不 同 。 

用 外 ， 还 有 所 谓 的 “辅助 变量 估计 ” 〈auxvar,m》 和 “预测 估计 ” (pemn.m》 。 对 于 
实际 系统 的 因 识 来 说 ， 应 该 选用 什么 样 的 模型 并 没有 一 个 可 遵循 的 厌 则 。 一 般 来 说 ， 可 先 
采用 简单 的 模型 ， 在 获得 辨识 结果 后 ， 检 验 模型 的 可 入 度 ， 如 果 不 能 满足 要 求 就 需要 换 用 
其 他 种 寞 型 ， 这 时 所 用 的 辨识 方法 自然 也 就 不 同 。 也 就 是 说 ， 解 决 一 个 实际 问题 ， 到 底 应 
该 采用 那 种 辨识 方法 ， 主 要 取 诀 于 模型 类 的 选择 ， 而 模型 类 的 确定 往往 需要 通过 多 次 的 实 
验 比 较 后 才能 确认 。 


e 人 0 《9.27) 





?y( 一 


9.7.3 库仑 摩擦 力 参 数 的 辨识 


库仑 摩擦 力 参 数 了 7. 的 办 识 既 可 以 通过 实验 求 出 ， 也 可 以 把 了 . 作为 待 辨识 的 参数 之 一 
与 其 他 系统 待 辩 参 数 4、8 同时 进行 辨识 ， 若 采用 最 简单 的 最 小 二 乘 模型 ， 此 时 的 系统 模 
型 可 以 写成 : 

4(C )y(D= BT)xu(+T (9.28) 
则 有 : 
7 外 = 中 18+el 
其 中 ， 
盏 = [全 一 Dy 丰 一 2 全 一 Ju-Da 人 -22 一 瑟 订 
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= az an 已 D 7 
以 此 方式 ， 可 以 采用 标准 的 最 小 二 乘 参数 办 识 方 法 ， 利 用 现 有 的 参数 辨识 软件 如 
MATILAB 参数 辩 识 工具 包 ， 并 在 系统 的 工作 点 施加 伪 随 机 二 进 制 信号 (PRB9S) 进 行 离线 参 
数 辩 识 。 


9.8 运动 控制 中 的 机 电 控 制 系统 


随 着 微 电 子 学 、 计 算 机 以 及 数据 处 理 技术 的 不 断 进 步 ， 控 制 系统 与 机 械 系 统 得 到 进 一 
步 的 有 机 结合 ， 使 得 在 对 机 械 系统 的 实时 控制 上 能 够 很 容易 地 运用 十 分 复杂 的 控制 算法 ， 
同时 也 使 整合 机 电 计算 机 控制 系统 更 具有 智能 性 和 易 使 用 性 ， 这 些 都 集中 地 表现 在 机 电 一 
体 化 的 计算 机 控制 系统 之 中 。 

机 电 计 算 机 控制 系统 一 般 由 三 部 分 组 成 : 

全 机 械 系 统 : 传感器 、 执 行 机 检 、 元 器 件 和 组 合 件 : 

贸 电 子 学 技术 : 微 处 理 堪 技术 、 数 字 通 讯 、 接 口技 术 和 系统 结构 ; 

早先 进 的 计算 机 控制 :系统 理论 、 信 息 技 术 、 发 展 的 软件 设计 、 仿 真 以 及 机 电 计 算 机 
控制 系统 的 实施 。 

对 机 电 计 算 机 控制 系统 的 三 个 组 成 部 分 ， 必 须 从 设计 的 最 初 阶段 就 进行 整体 化 的 考 
虑 。 即 去 考虑 机 械 系 统 、 电 子 党 技术 及 计算 机 控制 的 各 个 方面 。 


9. 8. 1 机 械 系 统 


采用 机 电 计 算 机 控制 系统 对 一 个 复杂 的 机 械 系 统 进行 控制 ， 虽 然 只 需要 用 到 被 控 过 程 
的 输入 、 输 外 数据 ， 但 对 机 械 系统 中 每 个 部 件 的 性 能 及 作用 的 正确 理解 与 认识 ， 对 于 正确 
的 系统 建 模 和 控制 器 的 设计 是 非常 放 要 的 ， 并 可 以 加 速 设计 过 程 。 

在 典型 的 何 服 控制 系统 中 ， 机 械 系统 是 由 通过 电子 集成 电路 控制 的 执行 机 构 组 成 的 ， 
并 通过 功率 放大 器 将 由 计算 机 产生 的 控制 信号 传送 给 执行 机 构 。 目 前 最 常 使 用 的 功率 放大 
器 是 脉 宽 调 制 功率 放大 器 (PWM)， 用 以 减少 功率 损耗 。 在 机 械 传感器 的 测量 中 ， 测 速 器 
在 用 来 测量 电机 的 旋转 速度 。 常 用 的 测速 器 为 位 移 测 量 计 ， 其 他 方法 有 用 电磁 感应 法 、 磋 
阅 衡 法 和 磁 应 力 法 设计 的 测速 器 或 精度 很 高 的 光电 编码 器 。 在 全 过 程控 制 系 统 中 ， 除 需 使 
用 传感器 测量 物理 量 并 产生 各 种 信 叶 外 ， 还 需 将 它们 转变 成 适当 的 形式 ， 以 便于 进行 元 部 
件 间 的 相互 联接 。 这 些 是 由 信号 转换 器 或 信号 调节 器 来 完成 的 。 最 后 ， 所 有 这 些 部 件 都 需 
要 电源 。 


9. 8. 2 电子 学 技术 


在 机 电 计算 机 控制 系统 中 , 微 计 算 机 有 时 被 用 来 当 作 控 制 器 。 它 的 操作 实现 三 个 功能 ; 
读 取 输 入 、 控 制 律 的 计算 和 结果 的 输出 。 控 制 回 的 控制 律 是 通过 软件 程序 执行 的 。 首 先 ， 
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AD 转换 器 将 执行 机 徇 的 槛 拟 信 切 转 换 成 数字 信号 ， 并 读 入 控制 器 中 。 在 进行 控制 策略 的 
计算 后 ， 信 和 号 被 转化 成 模拟 量 后 和 输出。 这 个 操作 过 程 可 以 在 凡 微 秒 的 间 也 内 完成 ， 并 不 断 
地 重复 。 在 每 一 个 间隔 之 间 ， 答 出 信号 是 以 不 变 的 常数 形式 一 直 保 持 到 下 一 个 局 期 。 目 前 
国际 上 除了 采用 微 控 制 器 产生 控制 信号 外 ， 数 字 信 号 处 理 器 以 其 速度 癸 、 功 能 强 和 易 使 用 
等 优点 而 被 广泛 地 应 用 。 所 以 对 数字 信号 处 理 器 的 深入 了 解 是 设计 一 个 机 电 计 算 机 控制 系 
统 的 基本 要 求 。 这 些 方面 包括 其 结构 、 特 性 、 功 能 及 接口 。 除 了 这 些 基本 知识 ， 为 了 执行 
好 入 制 策略 ， 设 计 者 必须 从 技术 与 应 用 方面 掌握 各 指令 的 功能 及 用 法 ， 各 种 工作 方式 、 中 
断 方 式 及 应 用 钦 件 库 中 各 种 通用 函数 的 调用 。 

先进 的 电子 技术 使 系统 吏 如 集成 化 ， 其 特性 之 一 就 是 通过 接口 能 够 使 所 有 的 元 部 件 同 
时 很 好 地 协作 。 计 算 机 与 共 他 装置 之 间 的 接口 是 借助 于 标准 的 联接 器 、 信 和 号 线 、 电 子 性 能 
以 及 数据 交换 方式 进行 的 。 标 准 化 器 件 之 一 是 RS-32C 接口 ， 另 一 个 是 IEEE-488， 执 行 机 
构 产 生 的 模拟 信号 与 出 计算 机 产生 的 数字 信号 之 间 的 接口 是 AD 和 DAa 转换 器 ， 数 据 是 
在 装置 之 闻 通 过 异步 或 同步 方式 进行 传送 的 。 








9.8.3 先进 的 计算 机 控制 


常规 的 控制 设计 方法 是 基于 一 个 线性 时 不 变 的 假定 设计 出 的 常 系数 算法 。 在 工业 应 用 
中 使 用 的 大 部 分 控制 距 是 PID 型 ,用 来 调节 PID 控制 器 有 多 种 不 同 的 方法 , Zieglerf-Nicholas 
法 基 较 流行 的 。 对 参数 随时 间 变 化 的 系统 也 机 采用 自 适应 控制 算法 。 自 适应 控制 系统 是 基 
于 对 一 个 传递 函数 的 递 推 个 计 , 然后 进行 控制 器 的 设计 。 这 时 实际 上 主要 循环 着 两 个 过 程 
被 控 过 程 模型 参数 的 估计 以 及 氟 用 的 控制 算法 的 订 算 。 根 据 实际 情况 ， 可 以 选择 各 种 模 
型 并 通过 软件 进行 系统 建 异 。 众 所 周知 的 有 关 参 数 辨识 的 递 推算 法 有 :， 最 小 二 乘法、 辅助 
变量 法 、 最 大 似 然 法 等 。 对 于 一 个 时 不 变 的 系统 ， 一 般 过 程 的 参数 辨识 与 分 析 以 及 控制 算 
法 的 设计 常常 采用 离线 辨识 ， 参 数 辩 识 是 通过 计算 机 辅助 设计 包 (〈CAD》 进行 的 。 自 适 
应 控制 器 的 设计 可 基于 最 小 方差 、 极 点 配置 或 LQG 设计 来 自动 调整 调节 器 参数 。 控 制 器 
也 多 许 进行 前 向 补偿 或 控制 。 

模型 仿真 通常 包括 一 组 微分 方程 或 差分 方程 。 传 感 器 、 机 械 部 件 的 执行 机 构 、 转 换 器 、 
滤波 器 及 信号 处 理 器 可 以 用 适当 的 数学 模型 进行 仿真 ， 然 后 通过 计算机 的 仿真 技术 对 整个 
系统 的 行为 进行 仿真 。 旭 今 ， 软 件 可 以 对 仿真 提供 各 种 的 方法 ， 既 能 够 对 微分 方程 〔 连 续 
系统 )， 又 能 够 对 差分 方程 《离散 系统 ) 和 含有 离散 与 连续 方 框图 的 混合 系统 进行 仿真 。 
由 于 仿真 参数 的 正确 性 是 获得 实际 精确 控制 结果 的 保证 ， 所 以 全 面 地 理解 机 械 系 统 以 及 电 
子 学 系统 每 一 个 部 件 对 仿真 过 程 是 相当 重要 的 ， 正 确 地 理解 和 使 用 仿真 软件 可 以 加 速 设 计 
过 程 。 

在 机 电 计 算 机 控制 系统 的 设计 与 实施 过 程 中 ， 软 件 的 质量 是 系统 是 否 成 功 的 重要 因 
素 。 可 以 说 ， 正 是 有 了 强 有 力 的 软件 包 ， 我 们 才能 加 快 设计 过 程 并 使 控制 系统 更 加 集成 化 。 
一 个 机 电 计算 机 控制 的 软件 设计 不 是 独立 的 ， 而 是 软 硬 件 之 间 、 机 械 电 子 之 间 的 连接 与 并 
行 操 作 的 结 舍 、 软 件 设计 的 核心 是 一 个 支持 实时 处 理 与 大 晶 批 处 理 的 操作 系统 。 一 个 完整 
的 支持 软件 包 在 控制 系统 中 是 相当 重要 的 ， 它 包括 语言 处 理 器 、 交 叉 屏 幕 编辑 器 以 及 可 用 
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于 任何 类 型 庶 用 的 标准 工具 包 。 应 用 软件 是 对 控制 系统 应 用 专门 开发 出 的 一 组 程序 ， 它 包 
括 数 据 采 集 、 模 型 辨识 、 控 币 器 设计 、 控 制 仿真 、 程 序 亦 换 以 及 控制 执行 等 。 例 如 ， 由 美 
是 人间 交加 六 全 人 人 

合 运算 、 信 号 处 理 以 及 图 形 仿真 的 高 性 能 的 软件 包 。 其 环境 允许 用 户 用 图 形 表 达 各 种 数 
学 公 直 并 产生 相应 的 用 高 级 语音 写成 的 子 程序 。 已 经 发 展 的 许多 功能 包括 各 种 气 阵 的 计 
算 、 图 形 显 示 功 能 、 控 制 系统 工具 箱 、 重 棒 控 制 工具 箱 、 系 统 辨识 工 具 箱 、 信 和 号 处 理工 具 
箱 、 状 态 空间 控制 工具 箱 、 优 化 工具 箱 、 神 经 网 络 工具 稍 、 频 率 响 应 控制 工具 箱 、 模 类 到 
辑 工具 箱 等 。 

数字 信号 处 理 器 发 展 起 来 的 应 用 程序 可 以 用 来 产后 、 测 试 以 及 调试 用 户 应 用 程序 。 铭 
如 在 DSP32C 中 ， 自 身 的 支持 软件 可 在 徽 计算 机 上 运行 ， 它 在 MS-DPOS 操作 系统 下 工作 ， 
其 软件 包括 汇编 肿 、 连 接 编 辑 器 、 仿 真 器 以 及 工具 包 。 其 汇编 语言 允许 程序 用 近似 C 语 
言 方式 进行 书写 ， 使 用 户 很 容易 掌握 。 








9. 8. 4 和 适应 运动 控制 应 用 的 例子 


运动 控制 涉及 线性 和 非 线性 过 程 ， 常 用 电机 作为 执行 机 构 ， 并 来 用 传感器 进行 状态 谈 
量 的 测量 。 运 动 控制 的 典型 特性 及 村 求 是 : 

全 被 探 过 程 通 常 是 稳定 葛 ; 

也 系 统 具 有 非 线性 ， 诸 如 静 、 动 摩 掠 力 ， 惯 性 负载 ， 执 行 机 被 饱和 特性 等 等 ; 

他 要 求 具 有 快速 的 动态 响应 、 高 质量 的 稳 态 精度 和 抗 非 线性 干扰 的 能 力 。 

在 本 应 用 中 ， 控 制 系统 跟踪 一 个 受 非 线性 摩 氛 力 干扰 的 直流 电机 的 速度 。 机 电 计算 机 
控制 系统 是 基于 PC-386， 一 个 嵌 于 计算 机 中 由 AT&T 公司 生产 的 数字 信号 处 理 回 DSP32C 
板 以 及 接口 电路 。 图 9. 9 给 出 了 整个 控制 系统 结 梅 图 。 采 用 基于 摩擦 力 撼 模 卉 的 直接 在 线 
地 前 向 补偿 与 常规 的 负 友 馈 控 制 器 相 结合 的 控制 策略 。 线 性 系统 参数 的 辨识 采用 ARMAX 动 
力学 模型 。 采 样 时 间 为 5 毫秒 。 辩 识 后 所 获得 的 被 控 系 统 的 线性 模型 为 : 








久 9.9 被 控 直 流 电 机 的 机 电 计算 机 控制 系统 结构 隐 


己 =0.0074z- XI- 0.9928z7) 
以 此 模型 进行 反馈 控制 器 设计 与 仿真 。 几 于 前 向 补偿 的 非 线 性 摩擦 力 模型 ， 是 通过 对 
被 控 电 机 实际 的 力 撼 一 速度 的 测试 曲线 ， 经 过 设计 、 仿 真 并 实际 验证 后 获得 的 ， 形 式 为 : 


-00001129| 叶 | 


他 {@)= 12300sgnfo)T1700s8gnfG) :ee 


其 中 ，sgn 为 符号 函数 。 力 矩 单 位 为 数字 计算 机 中 逐 算 用 的 “数字 ” 

以 此 方式 产生 一 个 稳定 的 具有 对 摩擦 力 和 干扰 进行 前 向 在 线 补 偿 的 负 玉 馈 控 制 。 

控制 信号 出 DSP32C 的 汇编 软件 执行 ， 实 时 控制 策略 是 通过 PSP32C 进行 操作 的 ， 然 
后 通过 DA 转换 ， 并 通过 功率 放大 后 生成 电机 的 万 矩 控制 。 速 度 的 测量 由 测速 计 执行 ， 
并 通过 一 个 16 位 Am 转换 器 变 成 数字 信号 后 送 入 计算 机 。 在 离线 的 模型 辨识 、 仿 真 以 及 
设计 过 程 中 ， 使 用 MATLAB 函数 文件 对 数据 进行 处 理 ， 并 进行 参数 估计 、 数 据 泪 波 和 控 
制 算法 的 仿真 。 系 统 控制 程序 是 由 C 诺言 写成 的 ， 用 它 米 控制 检查 输入 输出 操作 ， 并 将 
在 PSP32C 中 产生 的 数据 文件 格式 与 MATLAB 的 数据 格式 进行 相互 转换 。 

实际 的 机 电 计 算 机 系统 对 梯形 笨 入 信号 的 听 应 曲线 如 图 9.10 人 的 所 示 。 图 中 示 出 了 带 
有 自 适 应 摩 掠 力 补 偿 的 跟踪 啊 应 以 及 仅 采 用 季 规 控制 器 控制 的 速度 跟踪 响应 。 常 规 控 制 器 
是 用 极点 配置 法 设计 的 PI 控制 器 。 为 了 对 比 两 者 的 控制 效果 ， 图 9.10(b) 中 给 出 了 相应 的 
速度 响应 误差 则 线 。 从 中 可 以 明显 地 看 再 ， 由 常规 控制 器 所 无 法 很 好 跟踪 的 、 由 非 线性 摩 
控 力 影响 所 造成 的 零 附 近 的 跟踪 误差 ， 遂 过 自 适 应 摩擦 万 前 向 在 线 补 偿 得 到 了 乡 大 的 改 
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@) 具有 和 白 适应 摩 凉 力 补偿 与 仅 有 上 规 控制 器 (b) 具有 自 适 应 摩 氛 力 补偿 与 仅 有 常规 控制 器 
往 制 的 速度 控制 实验 响应 曲线 控制 的 速度 响应 误差 


图 9. 10 控制 系统 结果 对 比 医 
由 计算 机 或 微 处 理 机 控制 形成 的 机 电 计 算 机 控制 系统 不 是 新 的 工程 领域 ， 它 可 以 被 看 
作 一 个 由 机 械 ， 仪 器 、 先 进 控制 工程 以 及 微 处 理 器 组 成 的 集成 化 协作 工程 。 所 有 这 些 都 基 
于 执行 机 构 性 能 的 不 断 改 善 、 电 力 电子 学 揭 进 步 、 先 进 的 控制 策略 的 设计 、 数 字 信和 号 处 理 
器 的 发 展 以 及 计算 机 软件 和 毅 业 标准 软件 的 支持 。 随 着 科学 技术 各 方面 的 不 断 发 展 ， 一 定 
会 有 越 米 越 多 的 具有 集成 化 和 易 使 用 的 机 电 一 体 化 产品 进入 我 们 的 日 常生 活 中 。 





152 


9.9 非 线 性 直流 电机 仿真 模型 系统 的 建立 


物体 运动 在 零 速度 附近 产生 的 非 线性 摩擦 力 ， 是 运动 物体 所 同 有 的 特性 ， 人 存在 于 定位 
控制 、 低 速度 和 速度 变 向 的 伺服 系统 中 。 即 使 改变 阻尼 、 刚 度 、 边 界 润 请 等 因素 ， 也 很 难 
消 内 由 非 线性 摩擦 力 所 引起 的 振动 或 “ 死 区 ”现象 ， 这 类 问题 不 仅 在 滑动 或 电机 旋转 的 机 
械 中 广泛 地 存在 ， 而 且 在 机 器 人 等 高 精度 自动 化 设备 中 也 成 为 号 待 解 决 的 棘手 问题 。 和 在 现 
代 控 制 器 的 设计 过 程 中 ， 被 控 系 统 的 仿真 已 成 为 不 可 缺少 的 重要 一 环 。 它 对 系统 的 分 析 和 
研究 、 控 制 器 的 谨 计 与 参数 调试 、 甚 至 实际 控制 性 能 的 好 坏 都 起 到 关键 性 的 作用 。 虽 然 不 
依赖 于 模型 的 新 型 控制 策略 在 不 断 地 涌现 ， 但 即使 如 此 ， 在 设计 阶段 也 离 不 开 仿 真 系统 实 
验 的 调试 与 证 实 。 在 一 个 精确 符合 实际 系统 的 仿真 模型 上 所 获 香 的 仿真 实验 结果 与 实际 控 
制 效 果 相 差 无 几 。 

本 节 从 简单 的 直流 电机 六 于 ， 着 重 考 虑 其 运行 在 零 速 度 附 近 所 产生 的 非 线性 摩擦 力 的 
影响 ， 结 合 已 获得 的 研究 成 果 ， 利 用 SIMULINK 软件 ， 在 MATLAB 环境 下 具体 深入 地 建 
立 起 用 于 控制 器 设计 和 系统 仿真 的 非 线性 直流 电机 的 模型 系统 ， 在 验证 所 建 非 线性 系统 有 
效 性 的 同时 ， 也 显示 出 SIMULINK 软件 的 强大 功效 。 


9.9.1 被 控 过 程 线 性 段 模型 的 参数 办 识 


1) 实际 被 控 系 统 的 输入 /输出 特性 

实际 控制 系统 包括 一 台 Pentium 200 计算 机 、 一 抉 内 埠 于 计算 机 的 12 位 A/D,D/A 转 
换 板 、PWM 蕊 率 放 大 电路 、 直 流 力矩 电动 机 及 用 于 速度 反馈 的 直流 测速 发 电机 。 模 拟 电压 
输入 范围 与 输出 控制 电压 范围 均 为 三 5, 15]Y， 经 12 位 A/D,D/A 转换 后 的 数字 量 范围 均 
为 [-2048, +2048] ， 为 了 方便 起 下 ， 所 用 输入 /和 苯 出 单位 均 采 用 数字 量 。 被 深 系 统 的 模型 
包括 除 计 算 机 外 的 所 有 部 件 的 集合 。 

为 了 观察 实际 系统 在 零 速 度 附 近 的 输入 /输出 特性 ， 向 系统 输入 斜率 为 1 的 斜坡 信和 号， 
并 测量 系统 输出， 所 获 对 逐渐 上 升 增加 及 下 降 诚 少 的 输入 信号 的 响应 输出 如 图 9. 11 所 示 。 
从 斑 中 可 以 清楚 地 看 到 ， 系 统 在 输入 信号 小 于 某 个 值 的 范围 内 无 输出 信号 ， 即 出 项 所 谓 的 
“ 死 区 ”现象 ;而 在 输入 信和 号 的 绝对 值 大 于 一 定数 值 后 ， 其 输出 也 不 再 随 输入 信和 号 的 变化 
而 变化 ， 出 现 了 所 谓 的 “饱和 ”现象 。 这 两 者 都 是 机 电 控 制 系统 中 的 典型 非 线 性 现 银 。 另 
一 个 值得 注意 的 问题 是 : 对 于 上 升 和 下 降 的 输入 信号， 系统 的 特性 是 下 对 称 的 ， 这 无 论 是 
对 于 建 摸 ， 还 是 对 基于 模型 的 控制 器 的 设计 ， 都 增加 了 复杂 性 。 

为 了 进一步 观察 实际 被 控 系 统 在 零 速 度 附近 的 输入 /输出 特 竹 ， 吝 系统 输入 幅 值 为 300 
数字 值 ， 周 期 为 10s 的 正弦 信号 ， 在 5ms 的 采样 周期 下 ， 获 得 其 输入 /输出 特性 如 图 9. 12 
所 示 ， 丛 图 9. 12 中 可 以 看 出 ， 在 所 选择 的 工作 段 ， 将 近 40% 是 处 于 非 线性 摩擦 力 影响 之 
下 。 所 以 一 个 完整 的 电机 系统 模型 应 当 由 两 部 分 组 成 : 在 线性 段 工 作 的 线性 模型 与 在 非 线 
性 段 工 作 的 非 线性 模型 。 而 建立 系统 模型 的 目的 ， 则 是 通过 研究 仿真 系统 的 输入 /输出 特 
性 ， 得 到 与 实际 系统 性 能 相同 ， 并 能 够 代替 实际 系统 进行 控制 器 参数 设计 、 调 试 与 性 能 测 
试 的 可 靠 模型 。 
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Ce 一 


2) ARMAX 模型 辨识 
ARMAKX 模型 是 一 类 广泛 应 用 的 模型 结构 ， 它 可 以 通过 重 构 不 可 观测 变量 估计 出 模型 
参数 ， 并 能 够 在 估计 出 线性 模型 的 同时 估计 出 噪声 模型 。 这 更 加 符合 系统 的 实际 效果 。 
ARMAX 横 型 结构 的 形式 如 下 : 
4G@)=1+ag +…+ani9 
人)=-50 + 已 9 二 二 9 
C 人 @)=1+clg 了 +…+creTc 
4G@jy 人 = 89ju -不计 Ce 人) 
其 中 ，g-! 为 后 向 延迟 因子 ，Au 为 延迟 阶 数 ，e 优 ) 为 白 品 声 。 
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输入 时 间 ( 秒 ) 
图 9. 11 实际 被 控 系 统 在 斜坡 输入 作用 下 的 上 升 图 9. 12 实际 被 控 系 统 低速 下 的 输入 /输出 特性 


增加 【 实 线 ) 和 下 降 减 少 〔 叫 线 ) 的 输入 /输出 特性 
实验 中 用 于 线性 模型 辨识 的 输入 信号 为 仿 随 机 二 进 制 序列 (PRBS)， 并 将 其 加 在 一 个 
直流 分 量 上 。 其 中 PRBS 是 用 来 诽 行 参 数 辨 识 的 激励 信号 ， 而 直流 分 量 则 是 为 了 保证 激励 
信号 处 于 线性 工作 区 。 在 实验 中 ， 直 流 分 量 定 在 300。 激 励 信号 不 能 取 的 过 小 ， 否 则 会 降 
低 信 噪 比 ; 也 不 能 取 的 过 上 大， 否则 工作 区 将 变 得 过 大 甚至 使 系统 进入 非 线性 区 。 此 外 ， 由 
于 系统 对 正 负 输 入 信号 的 响应 具有 不 对 称 性 ， 所 以 需要 对 被 控 系 统 的 正 负 模型 分 别 进行 辩 
识 。 图 9.13 给 出 了 正 向 辨识 用 输入 /输出 信和 号。 
400 
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图 9. !3 用 于 系统 辨识 的 实际 系统 输入 与 所 获 系 统 输出 的 信和 号 
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离线 模型 的 参数 辨识 可 在 辨识 软件 下 进行 。 采 用 同 TLB 环境 下 的 系统 辨识 工具 箱 
(SID 。 首 先 通过 阶 数 辨 识 国 数 order'm 辨识 出 系统 的 延 时 阶 数 为 4=3。 阶 数 因 识 久 数 
orderm 主要 利用 了 SIT 中 的 另外 两 个 图 数 arxstruc.m 与 selstruc.m。 在 办 识 函 数 中 ， 
由 于 电 始 输入 /输出 信号 中 包含 附加 的 直流 量 ， 可 以 先 利 用 dtrend.nm 男 数 将 直流 分 量 去 
除 ， 然 后 再 对 处 理 后 的 输入 /输出 数据 进行 辨识 。 辨 识 时 所 取 的 数据 段 为 图 9. 13 中 的 700 
至 1900 段 的 数据 ， 通 过 运用 通用 ARMAKX 模型 的 辨识 函数 armax.m， 得 到 正和 宙 系 统 的 模 
型 为 : 


一 
+1-039700g_。 


-3 
yt)=_001029 ”ob 有 (9.29a) 


1-0.9931g-1 1-0.9931971 
采用 相同 的 方式 可 以 得 到 系统 的 负 向 模型 为 : 


0.0143573 1 一 0.9198or-1 
的 = 一 一 一 x+ 一 一 一 一 人 ec() 


= -re (9.29b) 
1-0.99104- 1 一 0.99109 


9. 9. 2 非 线性 模型 的 建立 及 仿真 系统 的 实现 


因为 被 控 系 统 40% 的 工作 区 在 非 线性 段 ,所 以 其 非 线性 模型 的 建立 具有 更 重要 的 意义 。 

一 般 认 为 ， 执 行 机 构 中 的 非 线 件 摩 控 力 与 速度 和 时 间 均 有 关系 。 在 从 静摩擦 力 过 湾 到 
动 麻 欣 力 的 过 程 中 ， 冯 动 经 历 了 四 个 阶段 ， 有 关 的 参数 有 了 个 ， 且 参数 必须 通过 实验 确定 ， 
所 以 对 这 种 非 线性 摩擦 力 模型 的 估计 是 相当 复杂 的 。 为 了 减少 工作 量 ， 人 们 常常 采用 简化 
的 方法 ， 著 取 近 似 的 或 抓 住 本 质 特点 的 非 线性 摩 掠 力 模型 。 这 样 ， 只 要 进行 较 少 的 实验 即 
可 确定 模型 的 参数 。 笔 者 曾 在 相关 的 研究 中 所 出 了 与 速度 成 指数 关系 的 非 线性 摩 掠 广 的 模 
型 形式 : 

Ti 外)= sign@ 这 +sign(@)( 一下)expm (9.30) 
其 中 ， 钙 为 输出 角速度 ， 泵 为 静摩擦 力矩 ，7 为 库仑 摩擦 力 矩 ，C 为 指数 时 间 常 数 ; 
signtw) 为 符号 函数 。 

入 和 天 的 值 可 以 通过 实验 来 确定 ， 比 如 通过 图 9.10 所 获 的 信号 ， 找 到 电机 从 静止 到 
开始 运动 时 所 对 应 的 输入 值 为 下 ， 而 从 运动 状态 减速 到 静 小 时 所 对 应 的 输入 值 则 为 了 。 

实际 系统 的 输出 是 线 件 模型 与 非 线性 摩 氛 力 共同 作用 的 结果 。 为 了 能 够 在 计算 机 上 重 
现实 际 系统 的 输入 /输出 特性 ， 应 当 在 已 获得 的 线性 模型 的 基础 上 结合 非 绥 性 摩擦 力 的 模 
型 。 在 此 采用 (9. 30) 式 作为 非 线 性 摩擦 力 的 模型 ， 并 通过 调整 参数 w 的 值 ， 使 结合 后 模型 
的 输入 /输出 特性 与 实际 系统 的 输入 /输出 特性 相 一 致 。 

可 以 说 ， 参 数 a 的 调节 是 一 件 耗 时 且 依 赖 于 经 验 的 工作 ， 不 过 在 SIMULIKME 的 帮助 下 
已 经 可 以 比较 容易 实现 w 得 的 调节 。 线 性 系统 模型 的 SIMULIKK 实现 如 几 9. 14 所 示 ， 从 图 
中 可 以 看 出 ， 昌 然 正 负 方向 的 模型 不 一 致 ， 但 实现 起 来 如 同 写 公 式 一 样 方便 ， 噪 声 的 实现 
也 是 相当 方 怀 的 。 为 了 简化 结构 , 在 SIMULIIEK 中 已 用 方 框图 将 图 9. 14 所 示 结 构 封 装 起 米 ， 
作为 一 个 子 系统 的 模块 放 入 。 图 9. 15 为 带 有 非 线性 的 系统 模型 , 其 中 的 Linear ModelWith 
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Noise Filter 即 为 图 9.14 所 表示 的 线性 模型 的 模块 。 图 9.15 中 其 余部 分 为 非 线 性 摩擦 力 
有 (表达 式 的 内 容 。 图 中 所 看 到 的 函数 项 疙 四 中 的 内 容 为 指数 冰 数 。 在 w 的 调试 过 程 中 
观察 到 ， 在 电机 的 加 速 及 减速 过 程 中 的 wx 值 也 是 不 同 的 ， 这 也 使 得 非 线性 摩擦 力 模 型 更 
加 复杂 ， 即 使 如 此 ， 采 用 SIMULINK 实现 起 来 并 不 国难 。 更 重要 的 是 ， 通 过 精确 的 模型 建 
立 ， 将 使 得 以 后 的 控制 器 的 设计 更 加 符合 实际 系统 的 要 求 ， 实 际 上 是 为 以 后 的 设计 打 好 基 
砸 。 整 个 系统 的 仿真 实现 如 图 9. 16 所 示 ， 其 中 Motor 了 Y_Model With Noise Filter 即 为 
图 9.15 所 表示 的 非 线性 模型 的 模块 。 另 外 ， 图 中 还 包括 用 于 产生 输入 信和 号 的 信和 号 发 生 器 
Signal Generator: 用 来 观察 不 同 点 信 生 显 示 的 示 变 器 Scope(i): 用 图 9.15 具有 非 线性 
的 系统 模型 在 MaTLAB 环境 下 进行 仿真 实验 时 ， 由 设计 者 定义 的 各 个 观察 变量 ;输入 参数 
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图 9. 14 线性 系统 模型 的 SIMULINK 实现 图 

















图 9. 15 被 控 冬 统 中 非 线性 部 分 的 模型 
信号 Re: 被 控 输 出 变量 yws 控制 变量 Us 等 等 。 这 些 可 以 使 设计 者 根据 不 同 的 需要 在 
MATLAB 末 境 (Workspace》 下 进行 数据 处 理 。 控 制 铝 的 设计 内 容 将 放 在 模块 Controller 
之 中 。 在 本 项 工作 中 ，Controller 中 的 内 容 仅 取 系 统 的 输入 ， 因 而 执行 的 是 系统 开 环 的 
测试 任务 。 一 旦 模型 的 各 个 参数 调试 完毕 ， 则 可 以 通过 图 9. 16 所 示 系 统 进行 仿真 实验 。 
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向 仿真 系统 输入 与 实际 系统 相同 的 输入 信和 号， 并 同时 将 其 输出 与 实际 系统 输出 进行 比较 ， 
用 于 对 比 的 实际 系统 的 输出 信号 了 是 通过 From Workspace 功能 模 蕊 获得 的 。 最 终 的 信和 号 
对 比 鲜 如 图 9. 17 所 示 ， 从 中 可 以 看 出 实际 系统 与 仿真 系统 之 间 的 一 改 性 。 

如 前 所 述 ， 对 线性 模型 的 辨识 是 在 输入 信和 号 幅 值 为 300 直流 量 上 和合 如 幅 值 为 50 的 父 
随机 二 进 制 序列 的 基础 上 获得 的 ， 所 以 此 种 辨识 方法 存在 着 一 个 工作 点 的 问题 ， 即 所 建 模 
型 一 般 只 适合 于 所 辨识 的 工作 点 的 一 定 范围 内 。 为 了 考察 在 不 同 工 作 点 下 的 仿真 系统 的 自 
适应 性 ， 分 别 对 系统 输入 信和 号 频率 保持 不 变 【 周 期 为 10 秒 钟 ， 即 闫 率 为 0. 628 弧度 / 秒 )， 
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0 2 4 6 8 10 
时 间 ( 种 ) 
图 9 17 输入 /输出 信号 对 比 图 

而 幅 值 分 别 为 250、300、350 的 正弦 信和 号， 以 及 幅 值 保持 在 300 厅 变 ， 增 大 或 减 小 输入 正 
纺 信 和 号 的 频率 进行 了 对 比 实 验 。 实 际 上 ， 摩 擦 力 表达 式 中 的 各 参数 ， 尤 其 是 库仑 摩擦 力 也 
对 于 不 同 幅 值 以 发 变化 速度 不 同 的 输入 信号 所 表现 出 的 值 也 不 尽 相 同 。 即 使 如 此 ， 采 用 
(9. 30) 式 所 提出 的 非 线 性 摩擦 力 的 模型 所 获得 的 仿真 系统 ， 在 所 做 的 实际 系统 与 所 获 仿真 
系统 的 对 比 实验 中 ， 对 于 输入 正弦 信号 杂 值 范围 区 间 [250, 350] 内 仿真 系统 的 响应 与 实际 
系统 的 结果 达到 了 相当 好 的 一 致 性 。 

本 节 结 合理 论 与 实际 应 用 的 实例 ， 详 细 探 讨 并 建立 了 一 个 机 电 系 统 的 非 线 性 模型 。 从 
系统 的 组 成 ， 模 型 的 选取 ， 到 MATLAB 环境 下 的 参数 辨识 ， 再 到 SIMULINK 下 的 仿真 过 
程 ， 重 点 做 了 复杂 的 非 线性 模型 的 建立 与 实 项 过 程 的 工作 ， 并 与 实际 系统 所 测 信和 号 进行 了 


性 能 对 比 利 验 证。 这样， 为 今后 的 控制 器 设计 与 调试 ， 以 及 控制 系统 的 仿真 实验 做 好 准备 。 
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第 10 章 模糊 控制 系统 的 应 用 


经 过 实践 ， 人 们 认识 到 模糊 逻辑 控制 技术 最 适合 用 于 闭 些 非 线 性 系统 和 在 其 输入 或 者 
对 其 操作 描述 存在 着 不 确定 性 的 系统 。 查 德 救 授 认 为 模糊 逻辑 对 于 大 的 自然 系统 ， 诸 如 天 
气 、 海 洋 系 统 ， 或 者 大 的 人 造 系统 ， 诸 如 经 济 、 股 票 市 场 和 国家 选举 等 这 样 的 系统 建 模 和 
控制 是 最 有 惠 的 。 用 模糊 逻辑 去 开发 控制 系统 已 经 获得 很 大 成 功 。 一 般 而 言 ， 在 控制 应 用 
中 ， 模 糊 逻 辑 可 以 应 用 于 非 线性 、 时 变 和 无 法 定义 的 系统 ， 最 适用 的 还 是 以 下 三 类 系统 ; 

也 由 于 太 复 杂 而 无 法 精确 建立 模型 的 系统 ; 

全 具有 明显 非 线性 操作 的 系统 ; 

@@ 其 输入 或 者 其 定义 具有 结构 不 确定 性 的 系统 。 

对 于 一 些 简单 系统 ， 有 些 可 以 知道 依 切 的 数学 模型 ， 有 些 甚 至 并 不 需要 逻辑 推理 或 者 
复杂 的 数据 处 理 ， 控 制 器 只 要 一 步 一 步 地 通过 预先 确定 的 作用 对 和 输入 作出 简单 啊 应 ， 对 这 
样 的 系统 就 不 需要 用 模糊 逻辑 去 实现 。 如 果 一 个 系统 的 经 典 控 制 方程 和 方法 已 经 经 过 优化 
或 者 完全 可 以 胜任 ， 己 经 形成 成 熟 的 方法 ， 一 般 情 况 下 ， 没 有 必要 因为 模糊 有 尿 辑 是 新 技术 
而 去 采用 它 。 但 是 当 现 有 方法 虽 可 胜任 ， 而 用 模糊 远 辑 方法 可 以 做 得 更 好 ， 蔡 至 要 好 得 多 ， 
或 者 由 此 有 可 能 开辟 一 个 有 意义 的 所 需要 的 新 功能 的 话 ， 则 应 当 采 用 模糊 逻辑 去 取代 它 。 

当今 自动 控制 理论 中 一 个 重要 的 研究 久 域 就 是 新 的 控制 策略 的 研究 与 探索 。 和 动 控制 
应 用 的 一 个 引 人 注 目 且 吸 引 越 来 越 多 的 专家 投入 的 领域 十 运 动 控制 。 其 中 需要 解决 的 一 个 
重要 的 实际 问题 是 : 电机 中 非 线性 摩擦 力 的 消除 与 补偿 。 在 小 功率 电机 广泛 运用 的 今天 ， 
在 跟踪 低速 或 变 向 运动 的 参考 依 号 时 ， 由 电机 中 的 非 线 性 特性 所 引起 的 误差 ， 采 用 古典 控 
制 理 论 设计 的 常规 拧 制 器 很 难 对 其 进行 补偿 与 消除 ， 控 制 系统 的 精度 很 难 达 到 理想 的 设计 
要 求 。 

为 了 解决 运动 控制 应 用 中 的 非 线性 问题 ， 人 们 不 断 地 引入 新 的 控制 策略 ， 从 而 使 得 控 
制 系统 更 加 具有 智能 性 及 抗 各 种 干扰 的 鲁 棒 性 ， 并 且 控 制 策略 的 使 用 与 实现 ， 不 需要 增加 
更 多 的 硬件 ， 上 只 要 一 个 以 数字 信号 处 理 器 为 基础 的 计算 机 控制 系统 ， 从 而 使 整个 控制 系统 
更 加 集成 化 ， 更 加 智能 化 ， 吏 加 具有 上 可靠 性 和 灵活 性 ， 也 更 加 具有 广泛 的 实际 应 用 价值 。 

智能 控制 系统 的 关键 在 控制 策略 上 。 一 个 好 的 蓉 制 策略 可 以 适用 于 普遍 的 一 类 问题 。 
利用 模 精 逻辑 控制 不 依 玖 于 被 控 对 象 数学 模型 的 特点 ， 可 以 设计 出 运动 控制 中 具有 摩擦 力 
影响 的 速度 模糊 逻辑 控 测 系统 。 通 过 计算 机 软件 米 实现 模糊 罗 辑 控制 系统 的 模糊 化 、 模 糊 
推理 和 解 模糊 三 个 处 理 过 程 ， 并 对 模糊 控制 系统 进行 计算 机 仿真 调试 。 最 后 与 常规 控制 
器 的 控制 效果 进行 老 较 。 


10.1 速度 模糊 控制 器 的 设计 


模糊 控制 器 选用 一 维 输入 和 一 维和 输出 。 输 入 变量 为 误差 吾 和 误 羡 变化 BEC， 输出 变量 
为 伺服 电机 力 抑 控制 量 7， 误 差 变化 在 计算 机 中 的 实现 是 采用 误差 采样 信号 的 一 阶 延 迟 。 
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误差 和 误差 变化 的 模糊 标记 分 别 为 12 和 11 个 变化 值 。 因 为 误差 的 正 零 与 负 零 对 电机 的 转 
速 来 说 是 表示 不 同 的 旋转 方向 ， 分 别 由 正 负 控 制 信号 产生 ， 所 以 有 不 同 的 意义 。 为 了 得 到 
平稳 地 跟踪 误差 信号 ， 素 属 函 数 选用 等 距离 变 叉 分 配 的 三 角形 ， 如 图 10. 1 所 示 。 
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图 10.1 导 和 生 的 隶属 函数 
模糊 控制 规则 通过 计算 机 中 程序 化 的 算法 来 完成 。 为 了 计算 的 方便 ， 控 制 规则 采用 带 
有 调节 因子 的 控制 算法 ; 
= 二 +-w)EC，we [0]] (10.1) 
在 通常 情况 下 选用 w = 0.5。 
控制 规则 含意 用 语言 变量 来 描述 ， 则 形成 为 : 
下 eeis 瑟 ANDecis EC THEN AS 《10.2) 
其 中 吾 和 EC 是 定义 在 五 和 EC 两 前 提 空 间 的 模 精 集合 ， 而 巡 是 结论 习 空间 影射 的 模糊 
集合 ，i = 1, 2.… , MW， 六 为 模糊 标记 的 数目 。 
对 于 任意 一 对 前 提 e 和 ec， 模 糊 算法 将 对 每 一 条 规则 根据 输入 前 提 隶 属 函 数 最 小 值 
法 得 到 其 规则 强度 ， 可 写 为 


Ci 一 上 FANDEC (eec 一 Thin[LP (人 sc (ec]] (10.3) 
根据 所 观察 到 的 输入 前 担 ， 模 类 控制 器 推导 出 一 个 模糊 结论 w， 它 的 素 属 函数 是 
Ar (本 = max [GD (OO] {10.4) 
1Si 克 


控制 输出 是 对 表示 模糊 控制 信号 尽 的 隶属 函数 图 形 进行 解 模糊 处 理 ， 同 样 为 了 计算 
的 方便 ， 本 例 采 用 单 值 的 工 形 作为 输出 变量 的 隶属 函数 ， 采 用 质量 中 心 法 (COG)， 结 合 加 
权 平 均 ， 计 算 控 制 输 出 精确 值 。 其 求解 公式 为 


_ 之 ji 有 DOXE 
Zi 


控制 器 的 输入 和 输出 均 为 计算 机 中 的 数字 景 ， 需 要 通过 量化 因子 量化 到 各 自 的 模糊 标 

记 上 。 从 模糊 控制 器 的 调试 中 发 现 ， 输 入 变量 的 基本 论 域 不 仅仅 表示 可 能 涉及 到 的 范围 ， 
更 重要 的 是 反映 了 控制 器 所 能 达到 的 精度 。 在 速度 控制 系统 中 ， 当 隶属 函数 和 控制 规则 依 
定 后 ， 输 入 变量 e 的 基本 论 域 体现 了 所 能 达到 的 精度 ， 尤 其 是 当 系统 参考 变量 有 可 能 在 较 
大 的 范围 里 变化 时 ， 对 于 跟踪 误差 来 说 ， 最 终日 的 总 是 希望 e 一 0， 所 以 应 当 多 从 精度 的 
角度 来 选择 误 关 的 基本 论 域 。 至 于 输出 变 基 的 量化 因子 ， 可 由 处 理 器 的 位 数 来 确定 。 如 对 
于 一 个 16 位 的 数字 信和 叶 处 理 器 ， 上 共有 11 个 模 灿 集合 的 量化 因子 为 所 = 人 53.6。 所 有 大 
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精确 输出 值 

















于 或 等 于 模糊 标记 4 的 控制 量 均 以 216 12 = 32768 值 输出 。 速 度 控制 系统 中 的 量化 变量 


革 系 如 表 10.1 所 示 。 
表 10. 1 输入 输出 是 化 变量 表 
六 


19600.8 





被 控 系 统 具 有 下 列 开 环 电机 械 方程 ; 
d0 


7 =-BO+T7-Tr (10.6) 
其 中 ， 必 为 角速度 ，7 为 总 惯量 ， 旦 为 粘 摩 氛 系 数 ，7 为 控制 输入 ， 卫 为 非 线性 摩擦 力矩 ， 
宁 的 精确 模型 选 为 : 
Zr = 工 Sgn(O)+ATe ”sgn(O) 《10.7 
为 了 使 仿真 结果 更 加 真实 地 把 出 精确 的 非 线 性 系统 特 人 性， 我 们 采用 (9.7) 式 对 被 控 系 
统 进行 仿 真 。 仿 真 系统 对 正 东 信 和 号 的 输出 以 及 所 测 实际 被 控 系 统 对 相同 信号 的 输出 如 图 
10.2 所 示 。 从 中 还 可以 看 出 被 控 系 统 中 存在 着 严重 的 非 线 性 死 区 和 饱和 特性 。 
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2 
时 间 (种 ) 
图 10. 2 被 控 系统 实测 和 仿真 输入 输出 特性 


被 控 系统 中 的 线性 部 分 是 通过 标准 的 ARMAX 办 识 。 得 其 方程 为 
-1 
ce- 一- (10.8) 
1 一 0.9932z- 
计算 机 中 的 模 精 逻辑 控制 仿真 系统 方 框图 如 图 10.3 所 示 。 图 中 电 驱 动 器 包括 被 控 站 
流 电 机 、 勒 率 放 大 器 、 信 和 号 比例 调节 器 ， 以 及 AD、D/A 转换 系数 等 整个 被 控 子 系统 ，S 


为 虚设 的 最 大 输出 控制 量 的 限定 器 。 














模 针 田 辑 榨 制 器 









图 10. 3 模糊 逻 旬 控 制 仿真 系统 方 框 男 
当 控制 规则 确定 后 ， 控 制 系统 响应 的 动静 态 性 能 就 由 成 、 关 .和 羽 , 来 决定 。 由 于 系统 
中 存在 着 严重 的 死 区 ， 而 正 、 反 两 个 方向 需要 施加 不 同方 向 的 力气， 为 了 避免 控制 力矩 的 
正 负 振 荡 ， 多 许 系统 有 一 定 范围 的 误差 ， 以 达到 平稳 控制 目的 。 为 此 ， 三 个 参数 的 选择 步 
骤 为 : 
输出 最 大 可 达 范 围 
DR = 


最 太 量化 级 别 

包 令 乒 =-0， 调 定 .， 使 系统 在 不 振 葛 的 前 提 下 ， 达 到 尽 可 能 大 的 稳 态 精度 ; 

鲜 适 当 增 加 天 .的 值 ， 以 提高 上 升 时 间 ， 同 时 又 不 使 系统 振荡 。 

经 验 表明 ， 误 差 巨 的 论 域 决定 了 控制 器 的 控制 精度 ， 所 以 其 量化 系数 应 根据 期 望 精 
度 来 确定 。 而 误差 变化 EC 的 论 域 决 定 了 上 升 速度 ， 可 在 具体 系统 中 根据 参考 量 的 可 达 范 
围 进行 调试 ， 以 达到 满足 跟踪 精度 和 响应 平稳 要 求 的 最 佳 值 。 

仿真 实验 是 通过 MATLAB 支持 下 的 SIMULINK 实现 的 。 常 规 控制 器 是 通过 极点 设置 
求 出 的 PE 控制 器 。 两 者 对 不 同 参 考 信号 的 响应 如 图 10.4 所 示 。 有 虽然 锯 控制 器 对 速度 控 
制 系统 不 产生 系统 稳 态 误 美 ， 但 其 上 升 时 间 显 然 比 模糊 控制 器 长 得 多 。 模 糊 逻 辑 控制 器 既 
具有 较 快 的 上 升 速度 ， 又 没有 响应 超 调 。 而 PI 控制 器 很 难 做 到 此 点 。 当 使 其 参数 不 产生 
超 调 响应 时 ， 需 赣 较 长 的 上 升 时 间 ， 更 主要 的 是 当 跟 踪 变 化 的 参考 信号 时 ，BI 控制 器 在 
零 输 入 附近 出 现 死 区 。 消 除 死 区 的 办 法 就 是 加 大 系统 放大 系数 的 值 ， 但 这 又 给 系统 带 来 超 
调 ， 同 样 需要 较 长 的 时 间 达 到 满意 的 控制 件 能 。 图 10.4(ay 和 人 b) 中 分 别 给 出 当 PI 控制 器 的 
比例 系数 六 为 7 ( 阶 跃 响 应 中 没有 超 调 ， 但 变化 信号 中 出 现 死 区 ) 和 42.3 (变化 信和 号 跟踪 中 
没有 死 区 ， 人 得 阶 跃 中 可 见 超 调 ) 时 模糊 逐 辑 控制 器 的 响应 时 线 。 由 此 可见 模糊 逻辑 搞 制 器 
具有 更 好 地 适应 参 数 变化 以 及 抗 下 护 的 能 力 。 为 了 进一步 比较 跟踪 误差 ， 我 们 将 模糊 控制 
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器 和 天 值 等 于 42.3 的 FI 控制 器 对 图 10.4(b) 中 的 梯形 信号 响应 的 误差 放 在 图 10.4(c) 中 。 
结合 图 10.4(a) 我 们 可 知 ， 在 上 升 速度 相同 的 情况 下 ， 对 于 图 10.4(b) 中 相同 变化 的 周期 参 
考 信 号 ，PI 控制 器 的 跟踪 误差 在 -150 +100] 转 / 分 之 间 ， 而 模糊 控 逻 辑 制 器 的 跟踪 误差 只 
有 +S0 转 / 分 。 这 又 更 加 证 明 模 贿 控 逻 辑 制 器 具有 更 好 的 响应 性 能 。 


| 





K2 = 42.3{PI 控 制 器 ) 模糊 控制 回 
下 ni 呈 
本 水 
的 Te 
化 K2 = 7(PI 控 制 器 ) 站 0 KK 一 42.3 
E 模糊 控制 器 三 下 [控制 器 ) 
攻 相 
塌 二 -2 
-4 
人 2 组 四 抽 2 
时 间 ( 秒 ) 时 间 ( 秘 ) 
fa) 对 阶 跃 信号 的 仿真 响应 人 b) 对 梯形 信号 的 仿真 响应 


常规 之 制 器 ) 
模糊 控制 回 


速度 误差 【100 转 /分 ) 





人 功 


20 
时 间 {( 秒 ) 
(ce)》 跟踪 图 10. 4 人 b) 信 和 叶 的 系统 误差 
图 10. 4 控制 系统 对 不 同 输入 信和 号 的 响应 图 


模糊 控制 器 是 一 个 按照 人 们 事先 设计 好 的 控制 规则 对 被 控 对 象 进行 控制 的 智能 控制 
器 ， 而 不 管 被 控 对 象 本 身 特 性 如 何 ， 均 能 很 好 地 按照 控制 规则 控制 系统 ， 所 以 它 是 一 个 非 
线性 控制 器 。 与 PID 控制 器 相 比较 ， 模 糊 控 制 器 的 响应 速度 快 ， 超 调 小 ， 卫 对 非 线性 系 
统 能 够 很 好 地 进行 控制 ， 只 是 对 速度 控制 有 一 定 的 稳 态 误差 。 这 可 以 通过 引入 神经 网 络 的 
训练 来 改进 隶属 函数 以 及 控制 规则 而 进 … 步 提高 控制 效果 。 总 之 ， 当 跟踪 不 断 变 化 的 参考 
信号 时 ， 利 用 贷 糊 控制 器 来 克服 非 线性 摩擦 广 的 影响 不 失 为 一 个 较 PID 为 好 的 控制 策略 。 
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10.2 三 种 控制 器 的 设计 与 性 能 比较 


模糊 还 辑 控 制 对 控制 复杂 或 无 法 用 简单 数学 模型 表达 的 系统 提供 了 一 个 实际 的 不 昂 泪 
的 解决 办 法 。 基 于 规则 的 神 糊 控制 器 不 需要 繁琐 的 数学 计算 和 复杂 的 数学 模型 ， 所 需要 的 
仅仅 是 对 整体 系统 行为 的 实际 理解 。 不 论 是 基于 数学 模型 所 设计 出 的 常规 共 制 器 ， 还 是 道 
过 实验 公式 或 经 验 得 到 的 模糊 控制 规则 ， 其 目标 都 是 一 个 ， 那 就 是 希望 对 于 参考 输入 产生 
期 望 的 输出 。 本 节 从 控制 器 规则 本 身 入 手 ， 通 过 控制 器 输入 输出 特性 表面 的 形状 ， 对 常规 
控制 器 、 一 般 模 糊 控 制 器 以 及 针对 有 具体 系统 设计 的 非 线性 模糊 和 辽 制 器 的 三 种 控制 规则 进行 
直观 地 对 比 ， 以 展现 各 控制 器 之 间 的 区 别 ， 以 及 非 线性 模糊 控制 规则 的 实质 。 


10. 2. 1 控制 算法 的 描述 


1) 常规 的 线性 控制 器 
从 所 周知 ，PD 控制 器 的 控制 算法 可 以 用 下 式 表 示 : 


xz(K) = 天 le 大 ) 十 玫 2e( 一 TD (10.9) 
此 处 ，& 名 为 第 大 个 采样 周期 的 控制 量 ，e( 可 和 e( 天 1D) 分 别 是 误差 信号 在 第 直 和 大 1 采样 周 
期 的 参考 信号 与 系统 实际 输出 值 之 间 的 差 值 ;， 态 和 瑟 为 比例 常数 。 


因为 (10.9) 式 是 个 线性 方程 ， 此 控制 器 的 特性 表面 是 一 个 平面 〈《 即 输出 控制 信 生 故 有 
与 输入 信号 et 和 和 ef( 天 TD 关系 的 立体 空间 图 形 )。 这 个 表面 如 图 10.5 所 示 。 





图 10.5 PD 控制 器 特性 表面 图 


2) 模糊 控制 器 

一 般 模糊 拉 制 器 的 输入 e、ec 和 和 输出 z 的 基本 论 域 取 : [-B ws， 已 ws]、[LEC，EC。] 
和 [-Vwx，zas]， 其 模糊 论 域 分 别 选 用 比如 12 和 11 个 模糊 集合 ， 这 样 可 得 132 条 控制 规 
则 。 量 化 因子 可 选 为 和 =SEs，K=SECos 和 天 ,=LUvS5。 输 入 变量 的 隶属 函数 采用 常用 
的 等 距离 交叉 分 配 的 三 角形 ， 如 图 10.6 所 示 。 
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as 


5 
图 10.6 2 和 不 的 隶属 函数 
输出 控制 变量 采用 单 值 的 工 形 隶属 函数 ， 通 过 质量 中 心 法 (COG)， 结 合 加 权 平 均 ， 可 
得 控制 输出 的 精确 值 ， 其 公式 为 : 
交 如 人 > (10.10) 
二 ;AT( 扣 


此 处 ， 忆 为 对 应 于 输入 变量 的 输出 模糊 标记 的 求 属 度 ; x 为 各 模糊 标记 值 。 
3) 非 线性 模糊 控制 规则 (NFLC) 的 设计 
在 此 设计 两 种 不 局 的 控制 规则 。 第 一 种 如 表 10.2 所 未。 这 是 大 们 常用 的 带 有 调节 因 


精确 输出 值 = 


子 # =int( 一 全 ) 的 控制 规则 。 





PD 型 模糊 控制 规则 





-10123 45 
加 -42333224 -10 
-4 3-3-2-2-1-101 
-3 3-2-2--10 11 
-2 2-2-1-101 12 
-1 2-1-101 1 22 
-0 -1 -0112 23 
+0 -1-10112 23 
1 -101122 33 
2 01I11223 34 
3 112233 44 
4 122334 45 
5 22334455 
按照 表 10.2 所 得 到 的 控制 器 的 误差 输入 e 和 ec 与 控制 输出 x 之 间 的 特性 表面 如 图 10.7 
妆 





-二 0-5 
医 10.7 PD 型 模糊 控制 规则 输入 输出 特性 表面 
所 示 ， 其 中 ，x、y 和 z 轴 分 别 代表 输入 输出 变量 e、ec 和 zx。 此 控制 器 的 特性 虽然 具有 非 
线性 ， 但 仍然 为 PD 输出 特性 《 见 图 10.77， 我 们 称 之 为 PD 型 模糊 控制 规则 。 


下 冯 RM rel-jruvrr- 


第 二 种 控制 规则 是 在 第 一 种 的 基础 上 进行 一 些 调整 ， 以 改进 系统 对 阶 跃 响应 的 过 渡 过 
程 状态 。 其 调整 的 主要 目的 是 在 初始 阶段 以 及 达到 稳 态 时 ， 加 大 误差 的 影响 ， 以 至 于 当 响 
应 开始 以 及 达到 稳 态 时 ， 能 分 别 有 更 快 的 加 速度 和 减速 度 。 我 们 称 此 为 非 线 性 模糊 控制 规 
虽 ， 如 表 10.3 所 示 。 

奏 10.3 非 线 性 模糊 控制 规则 
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非 线 性 模糊 控制 规则 与 PP 型 控制 规则 的 主要 区 别 在 于 “如 果 e 是 +5 且 ec 是 -5”， 其 
控制 输出 z 现在 是 “44”， 而 不 是 “0”。 这 样 ， 在 响应 的 初始 阶段 ， 我 们 忽略 了 ec 的 影响 。 
非 线性 模糊 控制 器 的 其 他 规则 , 是 在 不 同 的 模糊 标记 之 间 平 滑 地 改变 其 控制 信号, 另外 “如 
果 e 是 0 且 ec 是 0 那么 z 是 0”， 以 消除 稳 态 常数 误差 。 非 线性 模糊 控制 规则 的 特性 表 
面 如 图 10.8 所 示 ， 从 中 可 以 看 出 ， 规 则 在 e 为 0 左右 有 一 个 变化 点 以 适应 非 线 性 控制 的 





-所 -5 
图 10.3 非 线性 模糊 控制 规则 输入 输出 特性 表面 


10. 2. 2 结果 的 对 比 


对 三 种 不 同 的 控制 规则 均 进 行 了 仿真 实验 测试 和 结果 的 比较 。 被 控 系 统 为 一 个 存在 着 
严重 的 非 线 性 摩擦 力 影响 的 直流 电机 ， 其 位 置 控制 系统 的 线性 方程 为 ; 


0.2z-1 


= 一 一 一 一 一 一- 10.11 
(0.9928z-1)(G -xD 91) 
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非 线性 摩擦 力 模 型 运 过 实验 ， 信 定 为 指数 型 函数 ; 


和 aaa 人 >0 


、 10.12) 
7 10.23+0.09e0o2m ， 四 <0 


仿真 实验 是 通过 MATLAB 环境 下 的 Simulink 进行 的 。 采 样 时 间 为 5 毫秒 。 对 阶 跃 依 
号 的 跟踪 响应 如 图 10.9 所 示 ， 其 中 ，PD 控制 器 是 采用 极点 配置 方法 设计 的 。 虽 然 是 对 一 
个 非 线性 系统 进行 控制 ， 党 规 的 PD 控制 器 仍 能 表 了 现 出 较 好 的 控制 特 人 性， 这 是 因为 二 阶 位 
置 系统 本 身 带 有 一 个 积分 器 , 能 够 消除 库仑 摩擦 力 的 影响 。 虽 然 系 统 此 时 存在 一 定 的 超 调 ， 
但 具有 较 快 的 上 升 时 间 和 较 小 的 振 菏 。 
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图 10.9 三 种 控制 规则 对 位 置 跟 踪 控 制 系统 的 阶 跃 啊 应 

带 调 市 因子 日 x = 05 的 模糊 控制 器 在 对 具有 非 线性 扰动 的 一 阶 系统 进行 控制 时 ， 并 没 
有 表现 出 较 稼 规 控 制 器 更 好 的 特性 。 虽 然 经 过 努力 调节 其 他 可 调 因 子 ， 但 最 后 结果 仍然 具 
有 较 PP 控制 器 大 得 多 的 超 调 景 和 更 长 的 过 渡 过 程 。 对 系统 性 能 的 进一步 改善 没有 起 到 积 
极 的 作用 。 这 说 明 c= 0.5 的 模糊 控制 规则 不 大 对 任何 系统 都 能 达到 比 常规 控制 器 更 好 的 
效果 。 

图 109 中 的 非 线 性 模糊 控制 器 (NFLC) 对 阶 路 信号 的 跟踪 ， 给 出 了 一 条 近似 对 一 阶 系 
统 的 响应 曲线 ， 系 统 的 跟踪 既 绊 稳 又 快速 地 达到 稳 态 信号 ， 这 说 明 针对 有 具体 系统 设计 的 非 
线性 模 焰 控制 器 较 好 地 克服 了 非 线性 摩擦 力 的 影响 ， 因 而 表现 出 较 PD 控制 器 更 好 的 控制 
效果 。 

模糊 控制 器 能 根据 专家 的 经 验 对 非 线性 系统 进行 有 效 的 控制 。 实 际 中 的 模糊 控制 规则 
常常 采用 带 有 调节 因子 的 控制 规则 ,但 xz = 0.5(e+ec) 的 控制 规则 在 二 叭 位 置 控 制 系统 中 
呈现 出 和 PP 控制 髓 相似 、 甚 至 不 如 常规 控制 器 的 控制 效果 。 而 根据 具体 系统 的 非 线性 特 
性 设计 出 的 非 线性 模糊 控制 规则 ， 通 过 对 有 具有 非 线 性 摩擦 力 影响 的 直流 电机 的 仿真 实验 可 
看 出 ， 此 控制 器 对 阶 跃 参考 信号 的 响应 比 常规 控制 器 有 更 好 的 控制 效果 。 不 过 ， 由 于 影响 
模糊 逻辑 控制 器 的 参考 因素 其 多， 只 和 赁 经 验 或 人 工 调整 参数 达到 最 优 模糊 控制 既 费 时 ， 又 
困难 。 改 进 的 办 法 则 是 应 用 神经 网 络 自学 习 自 适 应 能 力 来 自动 调整 隶属 函数 和 控制 规则 ， 
以 达到 最 佳 设计 。 
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10.3 变 参 数 双 模糊 控制 器 


在 小 臣 率 电机 越 采 越 得 到 广泛 应 用 的 今天 ， 估 们 更 加 重视 对 电机 中 非 线 性 摩擦 力 的 消 
除 与 补偿 的 研究 。 采 用 经 典 控制 理论 设计 的 常规 控制 器 ， 在 实际 应 用 中 对 变速 或 变 向 的 参 
考 信号 进行 跟踪 时 ， 往 往 无 法 达到 令 人 满意 的 效果 。 与 常规 PID 拧 制 器 相 比 ， 模 糊 控 制 器 
对 阶 跃 响应 具有 上 天 速度 较 快 ， 过 滤 过 程 时 间 较 短 ， 对 参数 变化 不 繁 感 等 优点 ， 同 时 不 需 
要 被 控 对 和 象 的 精确 模型 ， 这 无 疑 有 助 于 对 电机 的 非 线性 的 消除 。 但 它 对 非 线性 的 消除 是 以 
降低 系统 稳 态 精度 为 代价 的 。 所 以 单个 模糊 控制 器 在 非 线性 补偿 上 受到 了 限制 。 通 过 前 面 
的 和 研究 表明 ， 直 流 电 机 中 的 非 线性 摩 掠 力矩 模型 可 以 由 下 而 的 公式 表示 : 
7 = sgnO)TAT esSgnO) (10.13) 
这 是 一 个 以 电机 区 速度 为 自 变量 的 指数 请 减 型 非 线性 函数 。 根 据 此 公式， 我 们 可 以 试 
为 ,直流 电机 中 非 线性 摩擦 力 的 影响 只 作用 于 速度 为 零 附 近 的 一 个 范围 人 罗 <wo 内， 在 此 
之 外 ， 干 扰 产 则 近似 为 一 个 常数 志 : 为 此 ， 我 们 设计 了 一 个 基于 经 验 的 变 参 数 双 模糊 控 
制 器 ， 其 拧 制 转换 开关 在 |y= oo 处 。 其 主要 思想 表现 在 两 点 上 : 


人 @ 在 四 < wo 时， 模糊 近 制 器 的 主要 日 的 是 非 线性 影响 的 清除， 

加 在 加 > oo 时 ， 控 制 的 重点 则 转移 到 系统 跟踪 精度 的 提 高 上 。 

此 控制 器 的 最 大 特点 为 ， 采 用 很 少 的 模糊 标记 和 简单 的 设计 方法 ， 并 以 oo 为 分 界 点 
来 进行 变 参 数 双 模 糊 控 制 ， 从 而 达到 比 常规 控制 器 和 单 模糊 控制 器 更 好 的 控制 效果 。 

在 下 面 的 几 节 里 ， 首 先 介绍 变 参 数 双 模 糊 控 制 器 的 设计 过 程 ， 重 点 在 于 解释 如 何 确定 
两 组 变化 的 参数 值 ， 然 后 对 所 设计 的 双 模糊 控制 器 进行 计算 机 仿真 实验 的 验证 ， 并 将 其 结 
果 与 常规 控制 器 以 及 单 模糊 控制 器 的 控制 效果 进行 比较 ， 最 后 给 出 小 缚 


10. 3. 1 参数 的 设 定 


已 模糊 远 辑 设 讨 
我 们 以 误差 刀 和 其 变化 值 5 作为 模糊 控制 器 的 输入 ， 以 何 服 电动 机 力矩 控制 量 已 作 
为 控制 器 的 输出 。 它 们 的 论 域 均 以 NEL( 负 人 ) 、NS( 和 小 ) 、ZO( 零 )、P8( 正 小 ) 和 天 (正大 
这 五 个 语言 变量 来 描述 ， 并 且 将 它们 分 别 定义 在 -2 , -1 ,0 , 1 和 2 附近 。 控 制 规则 采用 带 
调节 因子 w 的 算法 ， 即 : 
tr=a: 瑟 +U-o EC，xe[0H (10.14) 
在 实际 的 仿 嘉 实验 中 ， 我 们 得 出 w=05 是 较 好 的 取 值 ， 所 以 拧 制 规则 有 更 简单 的 表 
达 式 ; 
6 -2+ EC) (10.15) 


了 和 姨 的 录 属 函 煞 选用 等 距离 安 叉 分 配 的 夺 角 形 ， 如 图 10.10 所 示 。 
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到 10. 10 误 莽 二 和 其 变化 线 的 隶属 级 数 
为 了 使 控制 算法 简单 化 ， 其 模糊 推理 方式 采用 科 单 的 极 小 -加 法 -质心 推理 法 。 具 体 的 
做 法 和 10. 1 节 采 用 的 完全 相同 ， 即 每 一 规则 的 规则 强度 根据 输入 前 提 隶 属 函 数 最 小 值 法 
得 到 ; 


过 eis 五 | and ec js 严 C，then ais 也， 【10.16) 
控制 量 避 的 求 属 函 数 则 为 : 
RAT 之 [Go Ge 《10.17) 
] 关 弃 六 


解 模 糊 采 用 单 值 的 1 形 作 为 输出 变量 的 求 属 函数 ， 利 用 质心 中 心 法 4C06) , 结合 加 权 平 
均 ， 计 算 其 精 依 值 : 
之 iD 天 咯 


精确 输出 值 = (10.18) 
Ar 人 





2》 两 组 参数 的 设 定 

模糊 控制 器 是 根据 操作 者 的 经 验 而 设计 ， 所 以 对 所 要 解决 问题 的 准确 认识 和 深入 分 析 
是 设计 成 功 的 关键 所 在 。 在 隶属 函数 与 控制 规则 己 定 的 情况 下 ， 其 性 能 由 天 ， 玉 和 天 这 
三 个 量化 参数 米 决定 。 又 因为 控制 力 符 了 的 大 小 雪 接 与 ku 相关 ， 故 参数 设 定 从 Ka 入 手 。 


当 变化 的 参考 们 号 oj< oo 时 ， 系 续 处 于 非 线性 摩擦 方 歼 的 影响 区 间 。 此 时 因为 输入 


售 号 较 小 ， 控 制 力 矩 的 大 部 分 用 于 消除 非 线性 摩擦 力 矩 上， 只 有 小 部 分 用 来 控制 其 运动 。 
出 于 非 线性 摩 掠 力 朱 是 以 指数 型 通 数 迅速 衰减 的 ， 如 果 了 过 大 ， 则 随 着 需要 补偿 的 方 虐 
的 减 小 ， 会 使 输出 佑 号 过 大 而 产生 振荡 ， 甚 至 造成 系统 的 不 稳定 。 所 以 了 值 要 适中 ， 即 
要 适中 ， 以 刚好 抵消 常数 摩擦 力 定 值 为 最 佳 荐 化 因子 值 。 当 然 ， 由 于 态 值 的 限制 ， 系 统 
的 稳 态 精度 也 同时 受到 了 限制 。 确 定 了 所 之 后 ， 在 使 系统 稳定 的 前 提 下 ， 尽 可 能 地 取 较 
大 的 大。 值 来 获得 较 商 的 控制 精度 。 


当 加 > wo 时 ， 系 统 进入 线性 区 域 ， 此 时 有 Fr = 到， 以 制 力矩 只 要 在 克服 常数 摩擦 力 
矩 到 之 后 ， 再 施加 有 规则 的 控制 攻 即 可 。 所 以 此 时 可 以 在 保证 系统 稳定 的 前 担 下 ， 尽 可 
能 地 加 大 太 来 达到 提高 精度 的 目的 。 


在 作 了 如 上 分 析 之 后 ， 速 度 控制 系统 中 的 输入 输出 量化 变量 关系 的 设计 如 表 10.4 和 
甫 10.5 所 示 。 表 中 的 输入 和 输出 变量 值 为 计算 机 中 所 用 的 数字 值 。 





va vauhguaiugaigpa 和 Ha- 下 mm -ha 和 reee 


表 10.4 |g < oo 时 模糊 控制 器 给 入 输出 量化 变量 关系 





图 10.11 变 参 数 双 模糊 控制 器 的 系统 方 框图 
10.3.2 仿真 实验 验证 


为 了 验证 所 设计 的 变 参 数 双 模 糊 控制 器 的 控制 效果 ， 我 们 在 MATLAB 环境 下 用 
Simulink 进行 仿真 实验 ， 系 统 的 采样 时 间 为 5 毫秒 ， 这 与 实际 计算 机 控制 系统 的 情况 是 相 
符 的 。 仿 真 系统 方 框图 如 图 10.11。 

系统 图 中 的 变 参 数 双 模 糊 控 制 器 是 按 前 面 的 方案 设计 的 。S 为 虚设 的 输出 控制 量 的 最 
天 和 值 跟 定 器 。 电 驱动 器 部 分 包括 被 控 直 流 电 机 、 功 率 放 大 器 、 信 号 比例 调节 器 及 AD、D/A 
转换 等 整个 被 控 子 系统 。 

速度 控制 系统 的 线性 方程 的 己 域 传递 函数 与 (10.8) 相同 ， 为 : 
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10.z-1 


G(Cz = 一 一 一 一 一 (10.19) 
1 一 全 .9932 .7 
系统 非 线性 摩擦 力矩 的 模型 仍然 取 {9.11) 式 ， 为 : 
ee 站 > 0020) 
-0.23-0.09eotm， 四 <0 


输入 参考 信号 来 用 图 10.12 所 示 的 梯形 波 。 在 整个 信号 的 跟踪 过 程 中 ， 采 用 表 10.4 
和 表 10.5 所 设 定 参 数 的 双 模 糊 拧 制 器 参数 。 wo 取 40 转 / 分 钟 。 为 了 便于 比较 ， 我 们 同时 
对 系统 进行 了 PI 拧 制 器 的 实验 .图 10.13 分 别 为 变 参 数 双 模 糊 控制 器 和 PI 控 制 器 对 图 10.12 
输入 信和 号 的 响应 误差 曲线 。 可 以 很 明显 地 看 出 ， 虽 然 PI 控制 器 对 常数 干扰 不 产生 误差 ， 
但 在 跟踪 穿越 零 的 变 向 速度 信号 时 ,由 于 静 动 摩 氛 力 的 影响 而 产生 突变 的 跳跃 。 与 其 相 比 ， 
变 参 数 双 模 寡 控 制 器 具有 令 人 满意 的 控制 效果 。 它 根据 被 控 系 统 的 特点 ， 各 用 一 组 参数 分 
别 便 重 解决 问题 的 一 个 方面 ， 做 到 了 结合 两 个 模 类 控制 器 单独 使 用 时 的 优点 ， 同 时 回避 了 
各 自 的 缺点 ， 从 而 达到 了 较 好 的 控制 效果 。 在 两 个 控制 器 之 间 相 互 转换 的 过 程 中 没有 出 现 
大 的 误差 跳 唉 ， 这 也 是 单 横 糊 拧 制 器 与 PI 控制 器 相 结 合 所 不 能 达到 的 效果 。 


L 


输入 速度 {1000 转 ”分 ) 
司 


恬 寺 0 了 功 


时 间 ( 黎 ) 
图 10. 12 梯形 输入 小 形 


>] 


常规 控制 器 
A 灾 参 数 双 模糊 控制 器 


响 考 误差 (100 转 /分 





呈 


时 间 二 加 


钢 10. 13 变 参 数 双 模糊 控制 器 与 常规 控制 器 的 响应 误 盖 
为 了 更 深入 地 前 析 变 参 数 双 模 糊 控 制 器 的 特点 ， 我 们 将 其 与 单 模糊 控制 器 使 用 时 的 效 


果 进 行 比较 ， 其 帮 应 误差 如 图 10.14 所 示 。 从 中 可 以 看 出 ， 两 者 的 盖 别 仅 在 信号 为 零 时 刻 。 
170 





单 模糊 控制 器 昌 有 较 强 的 适应 参数 变化 的 鲁 棒 性 ， 伍 由 于 要 在 系统 稳定 条 件 下 兼顾 全 范 国 
的 跟踪 精度 ， 不 得 不 放弃 对 非 线性 进一步 的 补偿 而 保 证 一 定 的 稳 态 跟踪 精度 。 变 参数 双 模 
糊 控 制 器 可 以 在 保证 系统 稳定 的 前 提 下 进一步 对 系统 中 的 非 线性 进行 补偿 。 这 就 克服 了 单 
模糊 控制 器 的 不 足 ， 使 变 参 数 双 模糊 控制 器 比 单 模糊 控制 器 的 性 能 更 好 。 


了 


单 模 夭 控制 器 






变 参 数 双 模 硼 控制 器 


响 座 误 藉 (10 转 /分 ) 
1 


tw 


加 
时 间 (种 


图 10.14 双 模 糊 控 制 器 和 单 模 糊 控 制 器 的 响应 误差 
10.3. 3 小 结 


电 宙 中 的 非 线性 是 由 指数 型 的 静 动 摩擦 力 造 成 的 。 对 它 的 消除 与 补偿 ， 从 理论 上 讲 可 
以 通过 在 线性 控制 量 上 加 一 个 相反 方向 且 幅 值 相 等 的 摩擦 力 即 可 。 但 由 于 自身 的 非 线性 ， 
采用 常规 控制 器 很 难 将 其 预测 并 加 以 消除 。 单 模糊 控制 器 对 参数 变化 有 较 强 的 鲁 棱 性 ， 已 
能 较 好 地 补偿 系统 中 的 非 线 性 ， 但 由 于 系统 稳定 与 跟踪 精度 之 间 的 矛盾， 从 而 限制 了 对 非 
线性 的 进一步 补偿 。 本 节 所 提出 的 变 参 数 双 模 糊 控 制 器 设计 方法 简单 ， 仅 用 5 个 语言 变量 
就 达到 了 其 他 模糊 控制 器 采用 L1 个 语言 变量 时 的 控制 效果 。 能 够 很 好 地 兼顾 摩擦 力 补偿 
与 稳 态 精度 两 方面 的 要 求 ， 发 挥 了 模糊 控制 器 的 特长 ， 分 段 利 用 了 两 个 模糊 控制 器 单独 使 
用 时 的 优点 ， 取 香 了 比 常规 控制 医 及 单 模糊 控制 器 更 好 的 控制 效果 。 此 外 ， 本 节 提 出 的 变 
参数 双 模 糊 控 制 器 ， 可 以 扩展 到 变 参 数 多 模 精 控制 器 ， 用 来 解决 其 他 非 线 性 撑 制 问题 。 
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第 11 章 神经 网 络 的 应 用 


11.1 BP 网 络 结构 、 参 数 及 训练 方法 的 设计 与 选择 


前 向 BP 网 络 以 其 优良 的 非 线 性 逼近 性 能 ， 受 到 各 个 领域 人 们 的 关注 。 应 用 神经 网 络 
的 关键 在 于 网 络 的 结构 与 参数 前 设计 上 ， 而 网 络 结构 与 参数 的 设计 ， 首 先 取 决 于 对 人 工 神 
经 网 络 理论 的 理解 和 掌握 ， 然 后 取决 于 设计 网 络 的 实际 经 验 。 因 为 在 网 络 设 计 过 程 中 ， 涉 
及 到 较 多 参数 的 确定 。 例 如 网 络 的 层 数 、 每 层 的 神经 元 节点 数 、 初 始 值 的 选取 、 学 习 速 率 
的 确定 ， 最 重要 的 还 有 训练 算法 的 选 定 或 改进 。 这 些 对 于 初次 进行 网 络 设计 的 人 来 说 ， 往 
往 可 能 无 从 下 手 。 本 节 的 目的 在 于 根据 已 有 的 BP 网 络 设计 及 其 改进 方案 。 对 一 个 人 工 神 
经 网 络 进行 具体 的 设计 ， 遂 过 其 详细 的 设计 步骤 与 过 程 ， 对 网 络 隐 含 层 神经 元 数 、 初 始 权 
值 、 学 习 速 率 等 参数 在 BP 网 络 设计 过 程 中 的 关系 与 影响 ， 以 及 不 同 的 改进 算法 在 网 络 训 
练 中 所 起 的 作用 给 予 进一步 提示， 使 人 们 从 中 得 到 更 多 的 启迪 ， 以 便 使 更 多 的 人 能 够 设计 
出 效率 更 高 、 精 度 更 好 的 神经 网 络 。 

一 般 情 况 下 ， 一 个 BP 网 络 的 设计 应 当 考 虑 以 下 几 个 方面 ， 

也 网 络 结构 ， 包 括 网 络 层 数 、 每 层 的 节点 数 及 其 激活 函数 的 类 型 ; 

加 训 练 前 初始 参数 的 选取 ， 和 包括: a) 初 始 权 值 ，bj〈 初 始 ) 学 习 速率 ，e) (〔 自 适应 时 ) 
递增 《〈 减 ) 因子 的 选取 ， 巾 最 大 训练 次 数 ; 

七 权 值 的 训练 方法 ; 

多 各 种 参数 的 先后 调节 《选取 次 序 ; 

电 训 练 程序 的 编写 ; 

电网 络 的 最 后 选 定 〔 训 练 过 程 中 不 同 参数 情况 下 的 性 能 对 比 研究 )。 

以 上 所 有 的 方面 ， 必 须 经 过 上 机 训练 ， 经 过 多 次 的 调整 与 对 比试 验 才 能 设计 出 一 个 满 
意 的 BP 网 络 。 所 以 ， 只 通过 书本 ， 看 懂 BP 网 络 的 设计 原理 ， 训 练 权 值 的 计算 公式 和 设 
计 过 程 的 人 不 能 说 自己 已 掌握 了 BP 网 络 的 设计 ， 必 须 真正 自己 动手 ， 在 考虑 并 认真 去 实 
施 上 述 的 各 步骤 后 ， 设 计 出 一 个 达到 满意 精度 的 网 络 后 ， 方 可 说 已 色 有 了 些 设计 BP 网 络 
的 经 验 。 

下 十 就 上 上 述 设计 步骤 中 的 各 种 考虑 ， 给 出 一 般 在 网 络 设计 过 程 中 的 具体 考虑 。 











11.1.1 BP 网 络 的 设计 


人 工 神经 网 络 是 由 人 工 神经 元 的 并 联 和 / 或 串联 组 合 而 成 的 。 一 个 人 工 神经 元 是 由 多 
输入 节点 和 单 输出 节点 之 间 通 过 某 种 激活 函数 的 相互 联接 所 构成 的 单 层 网 络 。BP 网 络 是 
采用 误差 反 向 传播 算法 对 网 络 权 值 进行 训练 的 多 层 前 向 网 络 。BP 网 络 设 计 的 最 大 特点 就 
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是 网 络 的 权 什 是 通过 使 网 络 输出 与 样本 输出 之 间 的 误差 平方 和 达到 期 望 值 而 不 断 调整 网 络 
的 权 值 训练 出 来 的 。 为 此 ， 训 练 网 络 的 算法 是 能 否 达 到 训练 目标 的 关键 。BP 算法 十 每 个 
初学 者 邦 必 须 掌 握 的 训练 算法 。 但 掌 择 了 BP 算 汪 是 否 就 能 设计 出 满意 的 网 络 ? 回答 往往 
是 咎 定 的 。 因 为 BP 网 络 的 设计 过 程 是 一 个 参数 不 断 调整 的 过 程 ， 这 意味 着 是 一 个 不 断 对 
比 结果 的 过 程 。 所 以 此 过 程 是 比较 复杂 和 带 有 经 验 性 的 。 学 过 BP 网 络 理论 设计 的 人 者 已 
知道 ,在 BP 网 络 的 设计 中 ， 以 上 所 捉 及 的 都 是 必须 考虑 的 方面 。 但 是 如 何 考虑 ? 先后 顺 
序 是 什么 ? 对 于 不 同 的 设计 首 ， 由 于 理解 和 掌握 的 不 同 ， 经 验 不 同 ， 对 同一 问题 所 设计 出 
的 网 络 ， 在 网 络 结构 与 效果 上 都 可 能 会 有 很 大 的 不 同 。 

1)》 网 络 结构 

进行 网 络 设计 的 首要 任务 就 证 网 络 结构 的 确定 ， 这 包括 : 输入 / 和 输出 节点 、 层 数 、 每 
层 的 激活 函数 的 确定 以 及 隐 含 层 季 点数。 

(1) 输入 /输出 节点 

输入 / 输出 节点 是 与 样本 直接 相关 的 。BP 网 络 已 被 应 用 于 各 个 领域 ， 无 论 让 它 完成 
什么 任务 ， 都 必须 将 实际 问题 转化 为 网 络 能 够 接受 的 形式 一 一 数据 样本 。 如 果 样 本 税 式 已 
确定 ， 则 阅 络 的 输入 / 箱 出 节点 数 由 样本 固定 。 实 际 上 ， 在 太 多 实际 应 用 中 ， 是 需要 设计 
者 根据 实际 情况 来 确定 样本 的 ， 此 时 ， 输 入 /输出 节点 数 的 确定 也 是 需要 认真 考虑 的 ， 龙 
其 是 在 建 模 中 ， 如 何 设计 出 一 个 能 够 表现 出 被 控 过 程 动态 特性 的 模型 是 需要 相关 的 专业 知 
误 的 。 一 般 情况 下 ,输入 7 输出 节点 的 设计 是 需要 有 关于 网 络 实现 任务 的 专业 方面 的 知识 。 
网 络 实现 效果 不 好 的 绝 大 部 分 原因 , 是 因为 设计 者 未 对 所 要 实现 任务 的 输入 / 输出 变量 ( 节 
点 ) 数量 以 及 各 个 变量 之 间 的 相互 关 式 准确 掌握 所 致 。 而 这 一 点 是 网 络 设计 之 外 的 功 未 与 
知识 。 

(2) 层 数 

BP 网 络 所 具有 的 最 大 也 是 唯一 的 特点 是 非 线性 函数 的 逼近 ， 而 且 只 含有 一 个 隐 含 层 
的 BP 网 络 即 可 完成 此 任务 。 由 于 BP 网 络 的 功能 实际 上 是 通过 网 络 输入 到 网 络 输出 的 计 
算 来 完成 的 ， 所 以 多 于 一 个 隐 含 层 的 BP 网 络 虽 然 具 有 更 快 的 训练 速度 ， 全 在 实际 应 用 中 
需要 较 多 的 计算 时 间 。 另 一 方面 ， 众 所 周知 ， 训 练 速度 也 可 以 通过 增加 隐 含 层 节 点 数 以 及 
肝 用 更 好 的 训练 算法 严 达 到 。 所 以 ， 从 实用 的 角度 出 发 ， 除 有 特殊 的 要 求 外 ， 对 于 一 般 的 
应 用 铺 沈 ， 采 用 有 具有 一 个 隐 依 层 的 BP 网 络 就 能 够 达到 目的。 

(3) 每 层 激活 函数 

众所周知 ，BP 网 络 的 非 线性 通 近 能 力 是 通过 $ 型 的 激活 函数 体现 出 来 的 。 所 以 ， 隐 
含 层 中 一 般 采 用 S 型 的 激活 函数 ， 输 出 层 的 激活 函数 可 以 采用 线性 或 $ 型 。 当 希望 网 络 
的 输出 范围 是 Ce,+ee) 时 ， 应 当 采 用 线性 激活 函数 。 当 采用 $S 型 的 激活 函数 作为 输出 层 
的 激活 荔 数 时 ， 其 非 线性 遥 近 速度 快 于 线性 激活 函数 ， 但 此 时 的 网 络 输出 被 限制 在 (0 ， 
1) 或 (-1)》 之 间 。 

2] 客 个 初始 参数 的 取 慎 

在 网 络 初始 参数 的 确定 上 ， 最 主要 的 应 当 是 隐 含 层 节 点 数 S1 的 确定 ， 但 这 又 是 -- 个 
几乎 让 所 有 初学 者 困惑 的 事情 。 实 际 上 ， 隐 含 层 节点 数 应 当 根据 具体 门 题 , 通过 实验 确定 。 

作为 圆 络 设计 的 例题 ， 在 此 选择 - 个 简单 的 控制 器 设计 问题 ; 设计 实现 模糊 控制 规则 
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为 =int 了 (e+ec) 的 模糊 神经 网 络 控制 器 ， 此 处 我 们 定义 取 整 函数 int (9 为 不 大 于 x 的 最 


大 整数 。 
(1) 输入 /输出 数据 对 的 确定 
人 网络 由 两 个 输入 变 晨 e【 误 盖 ) 和 ee (误差 的 变化 ) 构成 输入 向 量 P = [eiecji 


@@ 期 望 目标 7=int 了 (e+ea ， 


对 于 山 输 入 变量 e 和 ec 以 及 期 望 的 输出 目标 号 由 此 可 以 得 到 采用 神经 网 络 实现 其 
控制 规则 的 输入 和 输出 向 晤 为 : 

P =[-2 -1012-2-1012-2-1012-2-1012-2-1012; 

-2 -2-2-2-2-1-1-1-1-100000111112222323: 
= [-2-2-1-10-2-1-100-1-1001-100110011 人 |; 

(2) 网 络 的 结构 

根据 以 上 分 析 ， 我 们 采用 2 - S$1 - 上 的 网 络 蛙 构 : 在 隐 含 层 采 用 S 型 激活 函数 ， 输 
出 层 采 用 线性 激活 函数 ， 隐 含 屋 中 神经 元 的 个 数 S1 待定 。 

(3) 隐 含 层 节点 数 S1 的 确定 

在 网 络 初步 确定 结构 后 ， 为 了 能 够 通过 对 网 络 的 训练 米 确 定 S1 值 ， 还 必须 在 训练 前 
确定 各 个 初始 参数 取 仁 。 

一 般 而 音 ， 学 习 速 率 1r 对 训练 结果 的 影响 在 于 当 1lr 过 大 时 ， 可 能 导致 系统 不 稳定 ， 
过 小 时 会 导致 较 长 的 训练 时 间 ， 一 般 lr 取 值 在 0.01 到 0.8 之 间 。 为 了 避免 误差 落 入 的 是 
误差 曲面 的 局 部 最 小 值 ， 并 显示 各 种 不 同 算法 的 优 劣 性 ， 我 们 确定 最 大 训练 次 数 为 10000 
次 ， 并 固定 县 标 函数 ( 均 方 误差 ) 为 0. 001 米 进 行 实验 ， 实 验 中 使 用 的 TLAB 版 本 为 6.2， 
实验 环境 是 PC-PIII500。 

到 最 大 训练 循环 次 数 max_epoch = 10000: 卓 标 误 盖 err_goal = 0.001。 此 时 ， 所 有 
参数 均 不 确定 ， 故 只 有 采取 淮 试 的 办 法 ， 通 过 禁断 实验 来 青 近 ,为 了 保证 一 定 的 收敛 速度 ， 
将 1lr 取得 稍 太 ， 通 过 训练 记录 数据 见 表 11. 1。 

表 11.1 取 Ir = 0.020 时 的 网 络 训练 记录 





10000 


10000 





由 表 1. 11 可 以 看 出 训练 效果 不 好 。 挫 测 是 1r 取 值 过 大 所 致 ， 因 而 使 得 系统 稳定 性 
不 好 , 故 减 小 1 的 取 值 ， 重 新 获得 训练 结果 见 表 11. 2。 

由 表 11. 2 可 以 看 出 :S1 的 增加 能 加 速 误差 的 下 隆 ， 但 是 随 着 S1 的 增加 ， 每 一 次 循环 
过 程 中 进行 的 计算 量 也 随 之 增加 ， 所 以 所 需要 的 时 间 不 一 定 随 之 减少 。 由 于 在 训练 中 ， 不 
同 S1 情况 下 的 初始 权 值 [YI0, Bi0]，[W20, B20] 均 是 随机 的 ， 均 对 8S1 的 性 能 比较 有 一 定 的 
影响 ， 但 我 们 仍 可 以 看 出 整体 趋势 : 当 S1 = 7，8，9，10，11，12 和 15 时 ， 都 是 能 够 解 


决 问题 的 且 误差 减少 速率 是 越 来 越 快 的 ， 不 过 从 网 络 实现 的 和 度 上 来 看 ，S1 至 得 越 大 ， 


网 络 实现 中 的 计算 就 越 费 时 。 根 据 S1 选择 在 能 够 解决 问题 的 前 提 下 适当 加 一 点 余 量 以 加 
194 





快 误差 下 降 速 度 的 原则 ， 根 据 表 11. 1 和 表 11. 2 所 示 的 具体 情况 ， 选 取 3S1 = 9。 
甫 11.2 取 Ir = 站 0 时 的 网 络 训练 记录 

误差 平方 和 训练 次 数 时 间 (! 种 ) 误差 记录 过 程 

4 0.7696 10000 276, 0600 “| 平滑 曲线 , 有 向 下 收 歼 趋势 


























500-800 问 有 气 刺 





































开始 明显 下 人 降 , 但 5500 次 后 有 小 毛刺 
263.9700 “| 下 降 趋 势 明 显 , 曲线 平滑 
261.5000 “| 快速 下 降 , 曲线 平滑 
平滑 快速 下 降 










10 003 | 1000 | 274. 1900 “| 明显 较 快 平滑 下 降 曲 线 
11 0. 1169 I0000 267. 6500 “| 1800 次 后 出 现 毛刺 , 有 下 降 趋 势 
12 0.0010 4663 


126. 3400 “| 很 快 的 平滑 下 降 
48. 2200 下 降 很 快 , 但 初始 误差 非常 大 , 芒 开 始 有 峰 





























3 初始 权 慎 的 选取 
一 般 取 初始 权 值 在 (C-11) 之 间 的 随机 数 。 另 外 ， 威 得 胃 等 人 在 分 析 了 两 层 网 络 呼 如何 


对 一 个 函数 进行 加 练 后 ， 提 出 一 种 选 定 初始 权 值 的 策略 : 选择 权 值 的 量 级 为 忌 sl ， 其 中 sl 


为 第 一 层 神经 元 数目 。 利 用 他 们 的 方法 可 以 在 较 少 的 训练 次 数 下 得 到 满 春 的 训练 结果 。 在 
MATLAB 工具 箱 中 可 采用 函数 nawlog.m 或 nwtan.m 来 初始 化 隐 含 层 权 值 W1 和 B1。 其 方 
法 仅 需 要 使 用 在 第 一 隐 含 层 的 初始 值 的 选取 上 ， 后 面 层 的 初始 值 仍 然 来 用 随机 取 数 。 在 本 
节 所 给 的 例题 中 ， 确 定 初 始 权 值 如 下 : 


[WiD,B10]=nwtanfS1,R)，[W20, B20]=rands(S2,S1): 


我 们 在 每 次 确定 的 SI 下 进行 5 次 训练 ， 从 中 选择 训练 结果 最 好 的 一 次 的 [W10, B10] 和 
[W20, B20]， 作 为 网 络 的 固定 权 值 来 进行 后 面 的 对 比 实 验 。 
在 $S1 =9，lr = 0.015 下 的 5 次 随机 实验 中 最 好 的 一 次 结果 为 : 


误差 平方 和 〔SSE) = 0. 00099989; 
训练 次 数 〈epochs) = 了 131; 
时 间 time) = 189. 390075 秒 ) 。 
此 时 对 应 的 初始 权 值 为 ， 
WLO =[2.2312 -2.2035;1. 1189 -0.6776;1.5390 -1.7795; 
1. 3675 1.3787;1.6230 1.4963;-0. 9914 -1.9675; 
1. 7568 2. 3563 ;~1.3277 1.1191;2. 9429 2.7832] 
B10=[-1.9254;-0.2765;2.0183;2. 6543;-0. 7643;1. 0097 ;-1.7705:-1.6106;2. 5937] : 
W20 =[-1. 3604 1.8750 -0. 7371 -1. 2319 1. 7746 0. 7099 -0. 8243 -0.8762 1.3169] : 
B20 =[-0. 1761] ; 
实验 中 发 现 初 始 权 值 对 训练 结果 的 影响 至 关 重 要 ， 即 使 是 很 微小 的 对 初 冶 权 值 的 改 
变 ， 也 会 带 来 误 竹 记录 的 剧烈 变化 ， 表 现 为 出 现 毛 刺 、 不 平稳 或 下 降 趋 势 改 变 ， 甚 至 出 现 
发 散 现 象 。 
4) 学 习 速 率 的 影响 
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19 Ag 利和 Mi 和 aihiiaiaiaialiaiai 和 本 理惠 省 


为 了 进行 对 比 ， 在 [W10,.B10], [W20, B20],Sl, max_epoch 和 ery_goal 给 定 情况 下 ， 改 
变 学 习 速 率 1lr 的 值 ， 分 别 对 网 络 进行 重新 训练 ， 获 得 记录 如 表 11. 3 所 示 。 


表 11.3 不 同学 习 速 率 时 的 网 络 训练 结 果 





















一 人 Te Tree 良 芝 训 永 过 和 
平 苑 下 降 曾 有 
10000 平稳 下 降 曲 线 


上 


| 0.0153 “| 0.00099999 “| 7913 “| 244. 6400 | 并 始 上 降 很 忌 ，6600 次 后 出 现 大 尖 刺 | 
0280 | 一 一 一 |- 一 | 一 一 一 


由 表 11.3 可 以 看 出 ， 较 大 的 学 习 速 率 在 训练 的 初始 阶段 能 加 速 误 莽 减少 ， 但 随 着 训 
绕 的 不 断 深 入 ， 由 于 学 习 速 率 过 大 ， 使 网 络 每 一 次 的 修正 值 过 大 ， 而 导致 在 权 值 的 修正 过 
程 中 超出 误差 的 最 小 值 而 永 不 收 伍 ， 另 外 较 大 的 学 习 速 率 也 容易 引起 振荡 而 难以 达到 期 塑 
目标 。 对 照 表 31,3 所 示 的 各 方面 因素 ， 可 取 17r = 0.0181。 


11. 1.2 采用 自 适应 学 习 速 率 与 固定 学 习 速 率 的 比较 


为 了 对 不 同 改进 算法 的 效果 也 进行 对 比 ， 特 采用 自 适 应 学 习 速 率 的 算法 ， 重 新 对 隐 络 
进行 训练 ， 此 时 取 初 始 学 习 速 率 值 1r = 0.020:， 递增 乘 因子 lr_inc = 1. 05， 递 减 乘 因子 
]r dec = 0.70;， 误差 速率 err_ratio = 1.04， 得 到 : 

SSE = 吕 00099753: 

epochs = 6728; 

time = 178. 1800(s) 。 

与 表 11. 3 中 辐 定 学 习 速 率 中 最 好 的 捕 况 相 比 : 

lLr = 0.0151; 

SSE = 人 00099982; 

ebochs = 7083; 

titme = 188.9400(s) ， 

显然 自 适 应 算法 的 要 收敛 快 ， 精 度 也 高 得 多 。 

当 采 用 自 适 应 学 习 速 率 进行 网 络 训练 时 ， 误 差 曲 线 是 呈 锯 齿 状 下 降 状 ， 学 习 速 率 也 是 
星 锯齿 状 。 这 是 因为 它 遵循 以 下 的 调整 规则 : 当 新 误差 超过 担 误差 一 定 僧 数 时 ， 学 习 速 率 
将 闫 少 ， 否 则 其 学 习 速 率 保 持 不 变 ; 当 新 误差 小 于 旧 误 差 时， 学 习 速 率 将 被 增加 ， 这 样 网 
络 总 是 以 最 天 的 可 接受 的 学 习 速 率 进 行 训 练 。 其 训练 效果 比 在 整个 训练 过 程 中 固定 一 个 学 
习 速 挛 要 好 得 多 。 
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11.1.3 改进 算法 的 性 能 比较 


保持 各 参数 不 变 ， 采 用 第 2 章 中 基于 非 线 性 优化 的 训练 算法 对 上 述 网 络 进行 训练 ， 并 
与 基于 标准 梯度 下 降 的 改进 方法 ， 如 :附加 动量 BP 算法 、 学 习 速 率 可 变 的 卫 算法 和 弹性 
BP 算法 进行 性 能 对 比 。 基 于 标准 数值 优化 的 改进 方法 有 共 斩 梯 度 算 法 ， 执 牛顿 汝 与 
Levenberg_Marguardt 法 。 作 为 本 节 例 题 中 对 各 种 改进 算法 的 性 能 比较 ， 其 训练 结果 如 表 
11.4 所 示 。 
表 11.4 不 同 改进 算法 的 训练 结果 记录 


算法 描述 











线性 搜索 
trainoss Dne_Step_Secant 一 步 割 线 
ES 
只 17 - 


trainrp | 阐 性 取 算 法 | 0000992987 | 57 | 76900 | 
从 表 11.4 中 可 以 看 出 ， 附 加 动量 的 卫 算法 、 变 学 习 速 率 的 了 算法 以 及 弹性 BP 算 


法 这 三 种 算法 的 收敛 速 度 从 训练 次 数 上 看 ,后 面 的 算法 比 前 一 个 算法 均 高 出 一 个 数量 级 ( 依 
次 为 10000，6728 和 517)， 其 中 弹性 BP 算法 速度 快 ， 计 算 量 也 不 大 ， 非 常 有 效 ，BFGs 
拟 牛 顿 法 效果 较 好 ， 一 步 割 线 拟 牛顿 法 与 共生 梯 度 法 差不多 ， 在 所 有 的 算法 中 ， 
Levenperg_Marquardt 法 的 效果 最 好 ， 它 的 运算 次 数 及 花费 时 间 都 是 最 少 的 。 

人 工 神经 网 络 训练 程序 的 编写 也 是 网 络 设计 成 败 的 关键 步骤 ， 因 为 它 是 将 设计 者 的 网 
络 说 计 结 构 与 算法 实现 相 结合 确定 网 络 参数 的 过 程 。 不 论 哪 种 算法 ， 基本 上 者 要 用 到 衣 数 
的 一 阶 甚至 二 阶 导 数 ， 癌 时 涉及 到 矩 阵 运算 ， 这 些 都 使 得 程序 编写 复杂 。 运 算 量 巨大 。 所 
以 在 可 能 的 情况 下 ， 应 当 尽 量 利 用 通用 可 靠 的 标准 程序 ， 如 国际 控制 界 常用 的 MATLAB 环 
境 下 神经 网 络 工具 箱 。 本 节 中 给 出 的 所 有 训练 算法 及 其 训练 过 程 ， 都 症 在 志 神 经 网 络 工具 
箱 的 帮助 下 完成 的 。 

由 Levenberg_Marquardt 法 训练 最 后 获得 的 网 络 权 值 [WlL， Bi1], [W2, B 下 的 设计 结果 
为 : 

YI=[3.0995 -3. 1661;1.2010 -1. 1431 ;1. 1149 -1. 5871;4. 1389 4. 1389; 

0. 0625 0. 3600:0. 4979 0. 1562;2. 4634 2. 4634;-1. 6657 1. 3309 :2. 7434 3, 6439] ; 
B1=[-1. 1019;-0. 4163;2.0054;:0.85401:0. 3124;0.831310.5292;3, 2671;1. 5999] : 
W2=[-1.8156 3.0747 -0.8320 1.0364 3. 2925 -0.6920 _f 1764 -0. 8911 -1.0187] ; 
B2=[-0,.7765] ; 
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11. 2 神经 网 络 在 电机 非 线性 补偿 中 的 设计 与 实现 


在 运动 控制 应 用 中 ， 存 在 着 大 量 的 以 电机 作为 执行 机 构 的 机 械 系统 速度 和 位 置 的 控 
制 。 执 行 机 术 内 部 的 静摩擦 力 所 产 生 的 非 线 人 性， 使 得 速度 或 力矩 输入 转向 时 ， 导 致 跟 啼 误 
差 。 如 果 对 此 非 线性 摩擦 力 没有 一 个 合适 的 补偿 ， 就 可 能 产生 低劣 的 动态 特性 。 在 以 微 处 
理 器 为 基础 的 运动 控制 系统 中 ， 由 常规 的 PID 控制 器 所 获得 的 精度 可 以 通过 对 静摩擦 力 
影响 的 补偿 而 进一步 得 到 改善 。 事 实 上 ， 神 经 网 络 以 它 的 自学 习 和 任意 逼近 非 线性 函数 的 
特点 ， 可 以 用 来 解 次 由 常规 方法 很 难处 理 的 非 线性 问题 。 

本 节 将 神经 网 络 使 用 在 伺服 电机 的 位 置 控制 系统 中 ， 所 设计 的 神经 网 络 补偿 器 对 由 欧 
摩擦 力 产 生 的 非 线性 进行 补偿 。 死 神经 网 络 荐 采用 间接 设计 法 完成 的 。 即 先 设 计 一 个 神经 
网 络 来 作为 非 线性 伺服 电机 的 仿真 器 ， 再 通过 此 神经 网 络 来 完成 对 补偿 器 的 训练 设计 ， 所 
以 设计 过 程 分 两 部 分 :首先 训练 一 个 神经 网 络 仿真 器 ， 为 非 线性 伺服 电机 建 横 ， 当 它 满足 
性 能 要 求 时 ， 凡 将 仿真 器 与 另 一 个 神经 网 络 柑 串 联 ， 设 计 训 练 神经 网 络 补偿 器 的 权重 值 ， 
使 之 成 为 非 线性 伺服 电机 的 赣 模 型 。 一 旦 第 二 个 神经 网 络 也 满足 训练 指标 ， 可 将 此 神经 网 
络 与 常规 的 PID 调节 器 并 联 使 用 。 常 规 控 制 器 在 负 反 错 系 统 中 实现 期 望 的 动态 特性 。 

在 下 面 凡 节 星 ， 首 先 描述 拧 制 问题 。 然 后 ， 通 过 所 采集 的 伺服 电机 的 输入 输出 数据 ， 
对 非 线 性 伺服 电机 的 神经 网 络 仿真 器 及 补偿 器 进行 训练 。 所 设计 的 神经 网 络 补偿 器 已 在 实 
际 的 运动 控制 的 位 移 控 制 系统 上 实现 。 最 后 给 出 神经 网 络 补偿 器 和 常规 控制 器 实验 结果 之 
间 的 有 意义 的 比较 。 


11.2.1 问题 的 提出 


共有 静摩擦 力 的 伺服 电机 的 动力 学 数学 模型 可 以 由 下 列 函 数 描述 ， 
do 
一 一 一 从 
二 


全 
=.wD+ 户 or) 


其 中 ，6 和 由 分 别 代表 角 位 移 和 和 角速度: Y 和 zy 分 别 表示 与 控制 电流 成 正比 的 电机 力矩 
和 力矩 干扰 ; 万 是 一 个 以 电机 参数 为 变量 的 线性 芳 数 ， 而 户 是 一 个 受 静 摩擦 力 影 响 的 
非 线 性 遂 数 。 图 11.1 所 示 为 正弦 输入 信号 下 ， 伺 服 电机 受 摩 擦 力 影 响 的 输出 位 移 信 号 。 

问题 是 ， 设 计 一 个 神经 网 络 补偿 器 ， 使 其 产生 控制 力矩 TU 来 获得 期 望 的 动 、 静 态 
特性 。 这 个 神经 网 络 补偿 器 最 终 通 过 与 一 个 常规 的 PID 控制 器 相 并 腾 来 实现 整个 控制 系 
统 ， 神 经 网 络 在 其 中 起 伺服 电机 道 模型 的 作用 。 


《11.1) 


11. 2. 2 伺服 电机 神经 网 络 仿真 器 的 设计 


伺服 电机 的 模型 可 以 通过 训练 一 个 采用 县 有 图 11.1 所 示 的 输入 输出 变量 的 前 向 多 层 
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神经 网 络 来 实现 ， 此 神经 网 络 的 训练 过 程 如 图 11.2 所 示 。 目 标 是 获得 实际 何 服 电机 位 移 
娘 嫩 的 满意 近似 值 。 可 采用 标准 的 反 向 传播 法 来 训练 神经 网 络 模型 丰 ， 神 经 网 络 的 权重 
值 歼 通过 使 得 下 列 误 差 函数 值 为 最 小 来 进行 调整 


了 = B16(O-80D]2 = E[IB(E)- OHY > 区)]2 《10.2) 


此 处 ，&) 是 训练 的 输出 量 ，Xtj) = [xD) xn] 7 是 神经 元 输入 撩 量 ， 而 Wi 六 = Two 


mwG 人 wm ] 是 在 丘 1 次 训练 时 的 权重 系数 , n 是 输入 层 的 输入 变量 的 数目 ， 让 = 12，.…， 
8 是 隆 含 屋 中 的 神经 元 的 数目 。 本 例 采 用 一 个 两 层 视 经 网 络 ， 在 隆 含 层 使 用 $ 型 函数 ， 在 
输出 层 使 用 的 是 线性 函数 ， 隐 含 层 中 采用 5 个 神经 元 ， 输 出 层 中 有 !1 个 神经 元 ， 如 图 11.2 
后 示 。 
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图 15. 1 填 入 伺服 电机 的 输入 输出 特性 
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图 11. 2 伺服 电机 模型 的 训练 过 程 





网 络 的 训 红 在 误差 平方 和 小 于 0. 001 或 当 循环 训练 次 数 达 到 所 设 最 大 值 2000 次 时 终 

止 ， 网 络 的 训练 过 程 通 过 MATLAB 神经 网 络 工具 箱 来 完成 。 图 11, 3 (a) 所 示 伺 服 电机 与 神 

经 网 络 仿真 器 的 输入 /输出 特性 曲线 ;图 11. 3 (b) 为 神经 网 络 训 练 过 程 中 的 误差 平方 和 的 
记录 ， 经 过 训练 ， 神 经 网 络 可 以 用 来 对 不 同 的 输入 信和 号 输出 近似 的 伺服 电机 的 行为 。 
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柯 服 电机 的 何 眼 电机 的 
神经 网 结 模型 实际 系 











4 04 一 总 站 1000 200D0 
力矩 输入 (牛顿 采 ) 宪 环 六 孝 


名 ) 输入 /输出 特性 则 线 他 )》 训练 过 程 中 的 误差 平方 和 
图 11.3 伺服 电机 神经 网 络 仿真 器 的 训练 记录 


11. 2. 3 神经 网 络 补偿 器 的 设计 


在 前 一 节 中 ， 获 得 了 何 有 最 电 机 的 神经 网 络 仿真 器 ， 本 节 通 过 将 仿真 器 与 另 一 个 神经 网 
络 串联 来 训练 伺服 电机 的 补偿 器 、 它 是 采用 伺服 电机 的 期 望 输出 与 何 服 电机 训练 输出 之 间 
的 差 来 调整 权 值 的 ， 所 以 训练 过 程 中 使 用 仿真 器 来 代 蔡 伺 服 电机 ， 并 且 用 仿真 器 输出 的 一 
阶 延 迟 作为 神经 网 络 补 偿 器 的 另 一 个 输入 ， 训 练 过 程 中， 仿真 器 的 权 值 保持 不 变 。 图 11.4 
为 神经 网 络 补偿 器 的 训练 过 程 。 
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图 11.4 神经 阿 络 补偿 器 的 训练 过 程 


开始 时 ， 神 经 网 络 的 输入 盐 期 望 角 位 移 Das0) 和 来 自 仿真 路 的 初始 输出 B(0) 。 因 为 神 
经 网 络 没有 经 过 训练 ， 它 给 出 不 正确 的 输出 控制 力矩 从 1)， 所 以 仿真 器 输出 8(D 也 是 不 正 
确 的 。 浊 时 ， BTD-BD 之 间 的 误差 道 过 反 向 传播 过 程 ， 被 用 来 调整 神经 网 络 补偿 器 的 权 
重 值 。 然 后 输出 欠 1) 用 来 做 为 神经 网 络 补偿 器 的 新 输入 变量 ， 它 产生 一 个 新 控制 力矩 TU2)， 
并 且 从 仿真 器 得 到 新 值 ， 再 次 修正 神经 网 络 补偿 器 的 权 值 ， 这 个 过 程 ~- 直 重复 到 获得 满意 
的 训练 结果 。 图 11.5 是 期 望 位 移 和 从 神经 网 络 补偿 器 与 仿真 器 串联 后 输出 值 的 比较 。 
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图 11.5 期 望 位 称 和 从 神经 网 络 补偿 器 与 仿真 器 册 联 后 输出 值 的 比较 





11.2.4 神经 网 络 控制 系统 


如 前 所 述 ， 在 一 般 的 伺服 电机 模型 中 ， 含 有 一 个 线性 部 分 和 一 个 非 线 性 部 分 ， 第 一 部 
分 代表 忽略 了 所 有 的 非 线 性 时 的 线性 电机 械 电路 特性 ， 第 二 部 分 描述 在 电机 转子 角 位 移 中 
的 非 线 性 的 影响 ， 如 果 线 性 异型 可 以 用 传递 函数 Psj 来 表示 ， 而 对 非 线 忻 影响 的 补偿 可 
以 通过 将 干扰 力矩 到 加 在 线性 模型 的 输出 力 符 上 来 实现 ， 干 势力 矩 部 分 有 关 静 摩擦 力 可 
以 用 广 来 表示 ， 而 用 了 来 表示 出 其 他 不 同 的 源 所 引起 的 干扰 ， 有 : 


T=T7r+7 (11.3) 
传递 函数 PHs) 有 下 列 结构 : 
天 
毕 一 -~ 
己 (一 站 (11.4) 
其 中 ，.7 和 8 分 别 表 示 惯 性 和 粘 摩 控 系 数 ,， 天 为 放大 系数 ， 它 们 的 值 可 以 通过 施加 合适 的 
控制 变量 ， 采 用 标准 的 ARMAX 辨识 过 程 求 得 。 

一 且 具 有 斤 模型 的 神经 网 络 被 正确 地 训练 由， 它 就 可 以 给 出 力矩 了 ， 其 中 包括 控制 
命令 和 摩擦 力 矩 用- 。 在 其 他 干扰 力矩 被 忽略 的 情况 下 ， 这 个 神经 网 络 补偿 器 与 何 服 电 机 
的 趾 联 所 实现 的 被 探 装置， 具有 等 于 1 的 输入 /输出 特性 。 为 了 获得 特性 指标 ， 只 有 由 其 
他 洲 所 引起 的 干扰 力矩 忆 的 影响 需要 被 消除 ， 为 了 达到 此 有 目的， 可 以 增加 一 个 负 友 馈 回 
路 并 采用 一 个 适当 的 调节 器 CCS)。 该 调节 器 的 传递 函数 的 设计 可 以 根据 性 能 指标 ， 采 用 
常规 的 或 先进 控制 策略 来 实现 ， 最 简单 的 方式 是 应 用 一 个 PID 控制 器 ， 并 根据 伺服 电机 
的 参数 值 来 对 其 参数 进行 调整 ， 图 11.6 所 示 为 被 控 体 服 电机 的 负 反 馈 控制 系统 方 框图 ， 
其 中 神经 网 络 与 负 友 馈 控 制 器 相 并 联 。 因 此 ， 通 过 神经 网 络 的 实施 ， 补 偿 器 主要 用 来 消除 
非 线 性 摩擦 力 的 影响 ， 而 闭环 动力 学 性 能 是 通过 负 反 铝 控 制 器 来 达到 的 。 
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神经 网 络 逆 模型 



































网 11.6 被 控 何 服 电机 神经 网 络 控制 系统 方 杠 图 





11. 2.5 实验 测试 结果 


实验 是 基于 IBMH PC-386， 内 岳 有 DSP-32C 板 。 直 流 伺 服 电 机 是 由 PWM 功率 放大 器 提 
供 的 电流 型 控制 ， 伺 服 电机 的 前 位 移 范 围 为 0 到 360 度 ， 目 标 当 静 误 差 | 口 < 口 小 于 0.5 
度 时 即 可 达到 。 控 制 策略 已 由 DNSP32C 汇编 语言 编 成 程序 ， 所 应 用 的 神经 网 络 补偿 器 由 DSP 
来 实现 ; 所 有 的 变量 都 经 过 DA/A 转换 ， 闻 大 后 产生 力 插 控制 信号 ， 位 移 是 由 位 测 传感器 测 
量 后 送 入 一 个 16 位 AD 变换 器 ， 实 验 的 实施 还 用 到 MATLAB 和 [语言 。 

实验 结果 如 图 11.7 所 未， 图 11.7(a) 为 期 望 的 角 位 移 波形 。 为 了 进行 比较 ， 我 们 还 
做 了 马 外 两 个 实验 : 仅 使 用 PIT 控制 器 而 没有 采用 摩擦 力 补 偿 和 采用 常数 天 对 摩擦 力 进 
行 补 偿 。 在 图 11.7(b) 中 ， 对 此 三 种 控制 情况 的 系统 误差 进行 了 比较 ， 其 中 ， 采 用 数字 信 
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ta) 期 望 角 位 移 波形 《bj 三 种 情况 的 系统 误差 比较 


几 11.7 实验 结 米 和 比较 
号 处 理 器 的 数字 单位 来 表示 它们 ， 从 中 可 以 很 容易 地 看 出 ， 当 没有 摩 疗 力 补偿 时 ， 系 统 误 
差 范围 在 +200 数字 ; 而 当 使 用 常数 ?, 时， 系统 误 差 范 围 为 t100 数字 ; 当 采 用 神经 网 
络 进行 补偿 时 ， 实 际 的 系统 误差 接近 于 0。 这 证 实 ， 采用 神经 网 络 进行 补偿 可 以 得 到 更 好 
的 结果 。 
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11.2.6 小 结 


静摩擦 力 是 在 小 体积 和 低 价 何 服 电机 中 不 可 避免 的 现象 ， 在 运动 控制 中 使 用 伺服 电 
机 ， 如 果 采 用 常规 的 控制 策略 ， 动 态 性 能 则 会 下 降 。 改 善 性 能 指标 的 唯一 方法 是 应 用 先进 
控制 策略 采 达 到 对 静态 摩擦 力 进 行 补偿 的 目的 ， 可 以 采用 数字 拧 制 器 的 采用 来 实施 各 种 不 
同 的 可 行 方法 。 从 终端 用 户 的 观点 来 看 ， 主 要 的 问题 是 在 保持 性 能 指标 质量 的 前 担 下 ， 提 
出 一 个 对 伺服 电机 且 有 调节 性 的 控制 策略 ， 从 生产 者 的 观点 米 看 ， 主 要 问题 是 通过 合适 的 
价格 和 所 要 达到 的 指标 洲 选择 控制 回 的 不 同 的 实施 方法 ， 从 控制 策略 设计 者 的 角度 来 看 ， 
主要 问题 是 获得 不 同 技术 的 可 能 性 。 对 化 类 控制 器 的 设计 ， 需 要 较 深 的 控制 理论 以 及 系统 
应 用 的 能 力 。 传 统 的 办 法 可 以 应 用 在 常规 控制 器 中 ， 但 不 可 能 获得 相同 的 性 能 特性 指标 。 

本 节 中 所 给 出 的 控制 系统 是 对 静摩擦 力 进行 补偿 的 一 种 可 行 的 实施 ， 用 训练 的 神经 网 
络 补偿 器 来 消除 非 线性 静摩擦 方 的 影响 ， 与 神经 网 络 相 并 联 的 负 反 馈 控 制 器 可 以 用 来 获得 
期 望 的 动态 特性 。 实 验 结 果 表 明 ， 相 对 于 常规 的 补偿 器 ， 此 控制 策略 能 够 使 系统 达到 更 高 
的 性 能 指标 。 ， 
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第 12 章 个 糊 神经 网 络 


12.1 引言 


模糊 系统 已 经 广泛 地 应 用 在 模糊 控制 器 、 模 式 识别 、 模 糊 辨识 和 信和 号 处 理 中 。 模 糊 逐 
辑 方法 的 优点 在 于 它 的 丈 辑 性 和 透明 性 上 ， 使 人 们 很 容易 将 先前 已 知 的 有 关 的 系统 知识 结 
合 到 模糊 规则 中 。 但 是 ， 模 糊 系 统 必须 包括 人 为 选 定 的 模糊 隶属 函数 的 模糊 化 过 程 和 采用 
适当 方法 的 模糊 规则 的 推理 过 程 ， 每 一 过 程 对 系统 的 执行 性 能 都 有 影响 ， 而 且 模 糊 系 统 中 
模糊 规则 的 前 提 和 结论 部 分 通常 都 是 模糊 子 集 ， 解 模糊 也 古 一 项 复杂 的 工作 ， 一 方面 ， 模 
糊 系 统 输 入 /输出 关系 式 是 高 度 非 线性 的 ， 要 想得到 一 个 满意 的 输入 /输出 关系 式 ， 在 众多 
需要 调节 的 参数 面前， 再 有 经 验 的 专家 也 难以 胜任 。 而 另 一 方面 ， 人 工 神经 网 络 的 最 大 益 
处 就 在 于 它 获 于 对 网 络 参数 的 自 适 应 学 习 ， 并 且 具 有 并 行 处 理 及 泛 化 能 力 。 这 很 自然 促使 
研究 者 进行 将 模糊 导 辑 和 神经 网 络 结合 成 一 个 系统 的 研究 ， 并 称 其 为 模糊 神经 网 络 或 模糊 
神经 系统 。 通 过 神经 网 络 实现 的 模糊 逻辑 系统 结构 具有 模糊 逻辑 推理 功能 ， 同 时 网 络 的 权 
值 也 具有 明确 的 模糊 逻辑 意义 ， 从 而 达到 以 神经 网络 及 模糊 逻 氏 各 舱 的 优点 弥补 对 方 不 足 
的 目的 。 

随 着 维 数 增加 柳 糊 系统 面临 规则 数目 的 指数 增长 。 过 去 的 大 多 数 模糊 应 用 是 低 维 数 ， 
一 般 所 使 用 的 仅仅 是 2 到 3 个 输入 和 1 个 输出 ,而 所 使 用 的 模糊 标记 大 多 是 5 或 7, 因此 ， 
使 用 的 规则 不 多 于 150 条 。 但 当 要 处 理 较 复 杂 的 金融 、 医 药 或 机 器 制造 系统 时 ， 简 单 模糊 
系统 可 能 运转 不 灵 。 这 样 ， 模 糊 系 统 专家 们 不 仅 需 要 大 量 的 规则 ， 而 且 需 要 大 量 好 的 规则 。 

学 习 可 能 有 助 于 在 有 限 条 规则 下 就 能 解决 这 样 的 难题 ， 学 习 可 能 移动 规则 从 而 调整 模 
糊 系 统 ， 学 习 可 能 来 自 于 一 个 数学 算法 ， 或 一 个 搜索 软件 ， 或 一 个 专家 的 猜测 ， 或 训练 和 
误 关 。 学 习 是 获得 新 的 更 好 的 规则 的 一 个 平 段 。 学 习 改 变 了 如 果 部 分 集 的 形状 或 位 置 ， 或 
者 改变 则 部 分 集 的 形状 或 位 置 ， 或 丽 者 都 有 所 改变 。 新 集 给 出 新 规则 ， 新 规则 给 出 新 系 
统 。 

本 章 从 模糊 关系 式 入 手 ， 分 别 对 直接 的 模糊 神经 网 络 的 实现 、 采 用 sugene 模糊 推理 
法 实现 的 模糊 系统 的 特点 、B 和 料 条 个 糊 神 经 网 络 以 及 径 向 基 琐 数 神经 网 络 等 系统 之 间 的 相 
互联 系 ， 以 及 各 自 所 表现 出 米 的 优 人 缺点 进行 了 性 能 分 析 与 对 比 研 究 ， 以 此 达到 使 人 位 对 模 
糊 神 经 网 络 有 更 加 次 入 的 认识 ， 更 好 地 设计 网 络 、 利 用 网 络 系统 完成 不 同 应 用 的 目的 。 


12.2 模糊 系统 的 关系 式 


考虑 一 个 一 般 形 趟 的 模糊 系统 ， 其 输入 是 xE BR ， 输 出 为 ME 及 。 志 和 ?的 论 域 


分 别 是 z ER 0=12…, 四 和 ?7E 召 。 z 的 语言 值 是 4 (大 =12……7m 和 守 =12,…, 关 )》， 
模糊 规则 的 数量 为 疡 = mlmoz …mn 。 第 天 条 规则 为 ， 
如 果 国 是 4 (zi)， 并 且 
如 是 422(xo)， 并 且 


2 是 Ab (xn )， 
那么 六 为 芭 ( 《12.17 
其 中 ， 其 COE7 ， 大 为 规则 基 的 数目 ， 有 上 =12…,P， 千 个 天 对 应 一 个 有 阶 序列 
天， 共 中 大 =12…,z。 若 采用 委 积 法 进行 与 操作 ， 那 么 第 天 条 模糊 规则 前 
提 部 分 的 真 值 厂 ( 妈 可 以 表示 为 : 


有 (可 = 4 人 0) 人 (= 了 4() 《12.2) 
i 


从 前 提 部 分 到 结论 部 分 的 推理 可 产生 一 个 结论 C ， 它 是 一 个 离散 的 、 有 具有 有 限 点 数 
的 模糊 子 集 ; 
C=Turpr =12 六 
其 中 ， 丰 /表示 在 点 由 Er 上 的 C 的 隶属 度 是 友 。 
采用 质心 法 对 模糊 集 C 进行 解 模糊 ， 系 统 的 实际 输出 为 : 


画 
站 (了 OO 
yx 一 (12.3) 
9 
一 


将 《〈12.2》 式 中 心 (Cn 的 值 代入 上 式 分 三 ， 上 式 可 重 写 为 ， 
Zuo- 及 屋 Acah 和 (oateco) 
=l 局 = 2 开 ， 5 


= 工人 cn) ,和 Ga)… 也 4 (xn 
后 =l 所 =1 


《12.4) 


所 以 【12.3》 式 变 为 ， 


yTJ4xco)rn 


00= 二 和 一 一 (12.5) 


好 (0) 守 Ch) 
品 = 后 = 


与 =] 


由 此 可见， 模糊 系统 的 输入 /输出 的 求解 关 系 式 是 相当 复杂 和 费 时 的 。 另 一 种 人 们 常 
用 的 模糊 推理 方法 足 所谓 的 最 小 推理 ， 即 将 关系 式 〈12.2) 中 上 0n 的 操作 变 为 取 小 运算 ， 
然后 再 通过 《〈12.3) 式 进行 解 模 糊 ， 并 通过 制 表 法 米 设 计 模 糊 逻 辑 表 。 不 过 这 种 取 小 运算 


] 8 





将 有 用 信息 簿 失 ， 利 用 信息 率 较 低 。 而 采用 《〈12.2) 式 中 的 乘积 操作 考虑 了 所 有 依 乳 的 弦 
响 ， 同 时 便于 用 神经 网 络 来 实现 模糊 系统 ， 因 而 得 到 广泛 的 应 用 。 


12.3 用 神经 网 络 直接 实现 的 模糊 系统 


模 害 集合 理论 提供 了 系统 的 、 以 语言 表示 这 类 迟 息 的 计算 工具 ， 通 过 使 用 由 隶属 邓 数 
表示 的 语言 变量 ， 可 以 进行 数值 计算 。 不 过 人 在 模糊 推理 系统 中 ,合理 选择 让 then 规则 是 模 
类 推理 系统 的 关键 因素 。 尽 管 模 糊 推 理 系统 拥有 模糊 正 then 格式 的 结构 化 知识 表示 ， 但 
是 它们 缺少 对 变化 的 外 部 环境 进行 适应 的 能 力 。 因此， 大 们 将 神经 元 网 络 中 学 习 的 概念 引 
入 模糊 推理 系统 ， 从 而 产生 神经 模 贿 系统 ， 它 是 神经 模糊 控制 系统 中 的 关键 技 术 。 

为 了 能 够 用 计算 机 对 模糊 逻辑 进行 实时 操作 ， 一 个 很 自然 的 想法 是 通过 神经 网 络 来 实 
现 模 糊 系 统 。 在 采用 神经 网 络 实现 模糊 化 、 神 糊 推理 和 解 模 糊 化 过 程 中 ， 为 了 和 运算 简单 ， 
最 直接 的 模糊 神经 网 络 系统 中 采用 的 模糊 推理 方式 是 用 乘积 一 求 和 代替 模糊 系统 中 常用 的 
最 小 一 最 大 推理 法 ， 且 输出 变 景 的 隶属 函数 取 单 值 型 。 























阐 12.1 其 有 模糊 到 辑 乌 能 的 神经 网 络 的 结构 
假定 输入 为 届 和 六 ， 模 灶 标 记 取 高 〈 琅 )、 正 〈《P)、 零 办 、 负 CN) 和 低 人 五 个 ， 由 
此 可 构造 一 个 具有 模糊 功能 的 神经 网 络 ， 如 图 12.1 所 示 。 





由 巍 12.1 可 以 看 出 ， 筷 是 一 个 具有 输入 层 、 小 间 层 和 输出 层 的 网 络 结构 ， 而 输入 
和 六 间 自 被 送 入 一 个 前 向 大 工 神经 网 络 ， 该 网 络 的 激活 函数 的 形状 即 代 表 模 类 隶属 函数 
的 形状 ,可 由 设计 者 确定 采用 线性 或 指数 型 ， 分 别 可 对 应 模糊 隶属 函数 的 三 角 型 和 高 斯 型 ; 
输入 层 神 经 元 的 个 数 代 朗 模 糊 标 记 数 ， 也 是 由 设计 者 选 定 。 通 过 调节 输入 层 网 络 的 权 值 
丈 和 偏差 召 ， 可 以 达到 调节 激活 函数 的 宽度 及 其 中 心 位 署 的 目的 。 

由 输入 层 输 出 的 如 、P、Z、N 和 工 分 别 伐 表 模 糊 化 后 的 结果 一 一 -隶属 度 。 中 间 层 执 
186 


行 的 是 将 模糊 化 得 到 的 带 属 度 黄 两 相 乘 的 功能 。 由 和 得 到 的 吾 值 与 六 得 到 的 互 值 相 乘 获 
得 85 值 ， 由 将 得 到 的 五 值 与 总 得 到 的 己 值 相 乘 获 得 妃 P 值 ， 以 此 类 推 ， 可 获得 由 辣 得 
到 的 工 值 与 心得 到 的 工 值 相 乘 得 到 开 值 。 所 以 在 图 12.1 中 所 看 到 的 瑟 本 、FP、.……、 贱 . 
等 节点 是 简单 的 匀 法 单元 ， 功 能 是 计算 出 相应 输入 的 乘积 。 最 后 乘法 单元 的 输出 通过 wm 包 
到 wB 的 权利 送 到 一 个 求 和 节点 中 ， 于 古 整 个 阿 络 的 输出 值 是 : 


8 = 末 , 盏 . 训 全 十 理 : 忆 罗 寺 十 下 :和 的 二 二 (12.6) 


这 问 实 现 了 乘积 一 求 和 的 模糊 推理 过 程 。 

此 网 络 的 最 大 优点 是 用 神经 网 络 实现 了 模糊 系统 ， 从 而 可 以 通过 训练 来 求 街 其 中 的 参 
数 ， 不 必 依 赖 专家 经 验 人 工事 先 确定 ， 做 到 了 自动 确定 系统 的 参数 。 系 统 的 隶属 函数 的 中 
心 、 宽 度 以 及 规则 等 全 部 参数 同时 得 以 自 寻 优 。 

该 模糊 神经 网 络 的 实现 是 通过 对 网络 采用 监督 式 训 练 来 确定 输入 岩 的 权 值 、 伪 差 以 及 
输出 层 的 权 人 东 。 由 于 该 网 络 不 是 标准 的 全 联接 ， 加 上 模糊 标记 一 般 情 况 下 比较 多 ， 所 以 网 
络 的 训练 速度 通常 是 相当 慢 的 ， 对 于 某 些 复杂 的 输入 /输出 关系 ， 网 络 的 训练 常常 很 难 收 
伍 到 期 望 的 极 小 值 。 另 外 ， 由 于 网 络 中 代表 模糊 标记 的 神经 元 数 必须 由 设计 者 事先 确定 ， 
它 的 数 日 对 网 络 的 精度 也 是 有 影响 的 。 








12.4 Sugeno 模糊 推理 法 


迄今 为 上 ， 大 位 党 用 的 模糊 推理 过 程 被 称 为 玛 达 尼 模糊 推理 法 ， 玛 达 尼 推理 中 的 结论 
部 分 是 模糊 集合 ， 对 和 模糊 集合 进行 处 理 后 ， 每 个 输出 变量 需要 被 解 模糊 。 在 实践 中 人 们 认 
识 到 采用 单 值 型 求 属 函 数 可 以 简化 计算 ， 提 高 解 模 崩 的 有 效 性 。Sugeno 〈 或 Takagi- 
Sugeno-Kang) 推理 法 对 结论 就 起 采用 单 值 型 隶属 函数 的 。S$ugeno 法 的 前 提 部 分 与 玛 达 尼 
推理 法 有 相同 的 结构 ， 而 结论 部 分 不 同 于 原来 的 模糊 集合 ， 它 用 一 个 前 提 部 分 变量 的 多 项 
式 表 示 ， 是 前 担 变 量 的 线性 函数 ， 并 采用 加 权 平 均 法 求解 模糊 。 
零 阶 Sugeno 模糊 系统 的 加 型 模糊 规则 有 如 下 形式 ; 
如 果 妇 为 4 ,并 有 旦 zx2? 为 B， 那么 7 = 天 012.7) 
此 处 4 和 了 吾 为 前 提 中 的 模糊 集合 ， 而 上 为 结论 中 一 个 可 调 参数 。 一 阶 Sugeno 模糊 系统 具 
有 的 模糊 规则 形式 为 : 
恕 果 拉 为 4 ,并 且 z 为 8B， 那么 ?= Pxl +Gxo 十 《12.8 ) 
此 处 4 和 号 为 前 提 中 的 模糊 集合 ， 而 P、q9 和 为 可 凋 参 数 。 想 象 此 一 阶 系统 运作 方式 的 
简单 方法 就 是 把 每 一 条 规则 认为 是 定义 一 个 “移动 单 值 ” 的 位 置 ， 即 取决 于 输入 值 的 单 
值 输出 可 以 在 输出 空间 中 移动 。 


作为 对 比 ， 这 里 需要 指出 的 是 : 如 果 将 烧 和 规 则 〈12.1? 中 的 世 四 设 署 成 一 个 由 输入 
矢量 表示 的 线性 组 合 ， 即 : 
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六 ( 间 二 三 十 人 十 2 《12.9) 


及 ”有 恰 


那么 由 《13.3》 式 所 示 的 则 为 采用 Sugeno 推理 法 时 的 系统 输出 。 

当 每 条 规则 在 系统 答 入 空间 中 是 线性 独立 时 ，S$ugeno 法 可 以 作为 对 一 个 非 钱 性 动力 
学 系统 进行 不 同 操作 条 件 的 复合 线性 控制 器 。 另 外 ， 一 个 Sugeno 系统 也 适用 于 非 线 性 系 
统 的 建 模 ， 它 是 通过 搬入 复合 线性 模型 来 实现 的 。 

由 于 输出 的 线性 组 人 台 ， 使 得 由 Sugeno 推理 法 求 得 的 异 糊 系统 比 用 玛 达 尼 法 具有 更 好 
的 效果 。 实 际 上 仅 从 模糊 系统 角度 来 看 ，Sugeno 推理 法 同样 存在 如 何 确定 有 效 的 模糊 规 
刚 的 问题 。 但 当 把 神经 网 络 与 其 相 结合 起 来 后 ， Sugeno 推理 法 才 显 示 出 它 的 优越 性 。 

表 1]2.1 中 给 出 Sugeno 推理 法 与 玛 达 尼 推 理 法 人 性 能 的 对 比 结论 。 有 关 采 用 Sugeno 推 
理 法 进行 网 络 设计 与 训练 的 例子 ， 请 看 第 13 章 。 

表 12. 1 Sugenoe 与 玛 达 尼 推 理 法 性 能 对 比 

Sugeno 推理 法 
号 有 效 的 计算 〈 直 接 由 输入 到 输出 的 点 到 点 的 计算 》 名 较 直 观 
名 与 线性 技术 〔〈 如 PID 等 ? 最 优化 技术 及 和 白 适 应 技术 能 一 起 很 | 名 披 初学 者 广泛 的 应 用 





好 的 工作 【〔 因 其 本 身 就 是 线性 复合 技术 ) 怨 较 适合 于 人 工 输入 规则 的 


名 保证 输出 空间 的 连续 性 情况 
色 更 适合 进行 数学 分 析 
己 参 数 的 确定 仍然 很 麻烦 








12.5 3B 样 条 模糊 神经 网 络 


通过 分 析 模 糊 系 统 的 推理 过 程 可 知 ， 系 统 主 要 有 三 个 可 进行 选择 的 部 分 ,隶属 函数 的 
形状 、 模 糊 规则 和 解 模糊 过 程 。 用 神经 网 络 实现 模糊 系统 的 另 一 思想 是 对 模糊 系统 中 某 一 
部 分 的 参数 实现 自动 调节 。 

对 于 隶属 国 数 的 调整 ，B 样 条 基 函 数 不 失 为 一 种 较 好 的 选择 ， 因 为 它 具 有 期 望 的 数学 
特性 ， 如 局 部 紧 支 撑 、 数 学 计算 的 简单 和 单位 分 割 性 。 将 B 样 条 基 国 数 作 为 隶属 函数 ， 
煌 造 一 个 卫 祥 条 模糊 神经 网 络 系统 也 是 大 们 一 直 关 注 的 。 


12.5.1 B 样 条 函数 及 其 网 络 


卫 样 条 是 基本 太 条 〔Basic Spline) 的 简称 。B 样 条 算法 最 重要 的 特性 是 由 其 函数 的 形 
状 而 能 够 产生 光滑 的 输出 。 另 外 ， 卫 样 条 函数 是 所 有 样 条 函数 中 具有 最 小 局 部 支撑 的 样 条 
函数 ， 所 以 B 样 条 基 函 数 可 以 精确 多 项 式 分 段 揪 值 的 方式 ， 对 给 定 的 输入 /输出 数据 进行 
光滑 的 曲线 拟 合 。1972 年 德 布尔 《de Boor) 和 考 克 斯 《Cox) 分 别 独 立地 给 出 关于 B 样 
条 计算 的 标准 方法 ， 证 明 B 祥 条 网 络 可 以 任意 精度 逼 近 一 个 连续 的 函数 。 
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和 机 nr 二 N Ar sd 


给 定 一 组 单 变量 x 的 节点 序列 ， 四 < xz <…< xs， 那么 在 区 间 {x ,xy ] 之 间 就 可 
以 唯一 确定 N+m 个 由 阶 线性 不 相关 的 B 样 条 基 函 数 ， 一 个 连续 函数 ?(x) 就 可 以 用 
1 -= N+m 个 卫 样 条 基 函 数 的 线性 组 合 来 近似 的 表示 为 : 


让 
7(0D= 》 @ 咖 nm 人 (th xzE[xr xn] (12.10) 
fi=1 
其 中 ， 四 | 为 第 i 个 大 阶 B 样 条 基 函 数 瓦 :9 的 权 值 ; 六 为 拟 合 点 的 项 点数。 当 有 具体 计算 


其 函数 值 时 ， 这 些 权 值 必须 被 估 值 。 
B 样 条 基 枯 数 满足 以 下 迭代 关系 式 : 








1 ， ET 
已 4 (对 = | 0 xx 。 
机 《12.117 
辟 (t) 一 二 瑟 5 (+ 下 呈 esiCb) ， 克 二 了 了 十 | 
天 HT 一 光 1 


出 〈12.11) 式 可 以 看 出 ， 一 个 大 阶 卫 样 条 函数 是 通过 比 它 低 一 阶 次 的 -1 次 多 项 式 
曲线 拟 合 获得 的 。 
B 样 条 函数 是 非 负 的 ， 耳 局 部 支 拓 的 ， 即 ; 


> 人 0， XE [xm 
- 1>. 
ao 其 他 〔《12.12》 
且 它 们 形成 一 个 单 份 分 割 ， 即 ， 
有 
> 下 (CD=l xe[x xz ]) (12.13) 


一 1 


多 项 式 阶 次 严 为 012.3 时 的 单 变量 H 样 条 基 函 数 曲 线 如 图 12.2 所 示 。 


1 1 1 1 
中 
恬 必 | 0 八 有 0 AN 
0 7 012 3 7 12343567 0123431 7 


(全 总 = 昌 由) 由 =! 人 丙 王 了 (中 下 =3 
图 12.2 阶 次 吨 为 01L2,3 时 的 B 样 条 基 范 数 曲 线 图 
由 此 可 见 ，B 样 条 的 阶 次 总 是 比 用 来 表示 此 阶 8B 样 条 的 多 项 式 曲线 的 阶 次 高 一 阶 ， 
如 一 阶 卫 样 条 是 由 六 =0 阶 直线 表示 的 ， 二 阶 B 样 条 是 由 严 = 1 阶 斜 线 表示 的 。 
对 于 多 变量 B 样 条 ， 可 以 假定 上 维 输入 失 量 x=ln,xzx 上 上 ， 在 每 个 输入 轴 上 定义 
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单 变量 B 样 条 基本 数 Bi (xi 后 =12…00i=12…, 天 ， 堵 么 ， 第 天 个 多 变量 B 样 条 基 
函数 Mk(z) 由 = 个 单 变量 基 函 数 Bw。 ( 石 ) 乘 积 〈 张 积 ) 组 成 : 


4 (= mn CD8 2 (xz2)… 0 (Cr )= 开 a ,0 (12.14) 
1 一 
ad 的 总 数 为 严 = ma 1， 所 以 大 =12……, 疡 。 
张 积 卫 样 条 基 函 数 仍 然 保留 〈12.12) 式 和 《12.13) 式 的 特性 。 
那么 一 个 多 变量 函数 xz 可 以 用 多 变量 B 样 条 基 函 数 的 线性 组 合 米 遏 近 : 


= 二 Ma -区 在 8 和 5 Ce) (12.15) 
站 

仔细 观察 可 以 发 现 ， 了 样 条 基 函 数 的 阶 数 上 与 不 同形 状 的 模糊 隶属 函数 相对 应 ， 如 当 

上 =2 时 ,用 了 样 条 作 的 曲线 正好 代表 三 角形 隶属 函数 ， 当 上 = 3 时 ， 所 作 疝 线 与 二 次 型 
隶 早 函数 相似 。 另 一 方面 ， 所 取 的 顶点 数 太 对 应 于 模糊 标记 数 。 节 点 数 则 在 一 定 范围 内 
次 定 了 个 隶属 函数 的 宽度 。 不 过 ， 高 于 一 阶 的 B 样 条 函数 并 不 一 定 是 一 个 正则 (normal) 
模糊 集 ， 即 B 样 条 函数 的 最 大 值 达 不 到 1， 而 通常 模糊 系统 理论 要 求 隶属 函数 为 正则 的 。 
为 了 满足 这 一 要 求 ， 可 对 B 样 条 基 函 数 乘 上 一 个 正则 化 因子 4， 以 使 其 最 大 值 为 1， 并 取 


隶属 函数 为 : 
4 = ) 4 (xz ) 
(12.16) 


AiC = 一 1 2, 


1 


将 (12. 16) 式 代 入 模糊 系统 输入 /输出 关系 〈《12.5) 式 中 : 


站 2 pi 
3( 本 一 殉 三 二 


天 k2 
三 和 B77 (0 忆 2B 
1 1 =1 


中 天 
吾 
人 二 及 7 (2 人 5 六 人 fo 


吕 下 
了 妈 > 卫 有 人 放大 
_ 上 = 二 。 
二 -一 【12.17) 
入 了 BP7 0 王 2 区 
二 7 2 2 人 之 ， Po/ 
大 = 


7/ 
= I 妃 mr 人 好 KU 
天 一 下 一 


与 (12.15) 式 完全 相同 。 由 《12.17) 式 可 以 看 出 : 采用 B 样 条 函数 作为 模糊 系统 的 隶属 函 
数 所 得 到 的 输入 /输出 甘 系 式 与 正则 化 因子 无 关 ， 与 用 多 变量 了 样 条 通 近 多 变量 函数 y( 
的 表达 式 完 全 相同 。 换 句 话说， 用 召 样 条 台 近 函数 的 表达 式 所 代表 的 就 是 一 个 模糊 系 统 。 
两 者 研究 的 出 发 点 旦 然 不 同 ， 但 达到 相同 的 结果 ， 和 解决 相同 的 问题 。 
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则 《12.17》 式 还 可 看 出 ， 我 们 可 以 通过 设计 求解 一 个 了 B 样 条 网 络 函数 来 建 世 一 个 模 
糊 系 统 。 因 为 着 者 所 表达 的 实质 内 容 是 完全 等 价 的 。 设 计 者 只 要 事先 网 定 了 多 项 式 的 阶 数 
站 《 即 隶 属 函 数 的 形状 )， 拟 合 点 的 项 点 数 〈 即 模糊 标记 数 )， 被 拟 合 的 点 至 少 必须 有 NHzm 
个 。 网 络 范 数 中 唯一 需要 优化 的 是 权 值 系数 w， 它 代表 异 糊 系统 中 推理 规则 的 结论 部 分 ， 
它 的 选取 可 以 通过 不 同 的 优化 算法 来 求解 ， 以 达到 优化 模糊 规 则 的 目的 。 则 于 了 样 条 网 
络 采 用 多 项 式 计算 ， 使 其 比 单 纯 的 用 神经 网 络 的 指数 遂 数 作为 隶属 函数 的 模糊 系统 的 求解 
节省 时 间 。 

由 以 上 分 析 梧 得 出 如 下 结论 : 

单 变量 B 样 条 基 函 数 精确 地 再 现 了 模糊 导 辑 控制 所 使 用 的 不 同形 状 的 求 属 函 数 , 即 通 
过 选取 不 同 的 阶 次 ,可 以 用 B 样 条 基 函 数 的 多 项 式 递 推 公式 米 计算 图 12.1 模糊 神经 网 络 中 
输入 层 的 输出 值 : 、P、Z、AN、 工 等 。 再 者 ， 比 较 (12. 后 式 和 (12.17 式 ， 可 以 发 现 , 一 个 多 
变量 B 样 条 函数 正 是 一 个 出 乘积 求 和 推理 方式 组 成 的 慌 糊 神经 网 络 的 输入 /输出 关系 的 算 
式 。 即 多 变量 B 样 条 网 络 在 结构 上 与 模糊 神经 网 络 之 间 存 在 着 相等 的 对 应 关系 。 在 多 变 


呈 B 样 条 网 络 算式 (12.17) 中 ， B)6 (xj 对 应 于 单 变 量 的 隶属 函数 值 ， 丰 Bi (rwt 对 





应 乘积 规则 ， 网 络 通过 最 后 的 求 和 进行 了 中 心 法 逆 司 糊 的 过 程 。 所 以 B 样 条 网 络 结构 与 
模糊 神经 网 络 结构 在 处 理 信 息 的 能 力 上 是 等 价 的 。B 样 条 网 络 的 这 种 透明 度 是 一 般 神 经 网 
络 所 不 具备 的 ， 也 是 一 个 极 有 价 伍 的 特性 ， 因 为 它 多 许 设计 者 用 自然 的 、 一 般 由 专家 解释 
其 行为 时 所 使 用 的 模糊 术语 浅 初 始 化 网 络 ， 并 通过 优化 算法 对 参数 进行 优化 ， 且 仅 采 用 多 
项 式 计算 ， 省 去 了 一 般 神 经 网 络 中 的 非 线 性 描 数 激活 转移 函数 的 复杂 运行 ， 从 而 简单 易 行 
和 省 时 。 采 用 多 变量 B 样 条 网 络 建立 的 横 糊 系统 ， 相 当 于 采用 B 样 条 基 函 数 作为 隶属 函 
数 ， 采 用 优化 算法 对 模糊 规则 进行 自动 寻 优 的 模糊 系统 。 优 点 是 : 算法 相对 省 时 ， 但 缺点 
是 : 中 求 属 函数 的 模糊 怀 记 数 事 先 必 须 确 定 ， 加 各 隶 属 函 数 之 间 大 等 距离 的 ， 而 不 是 自动 
寻 优 的 。 








12.5.2 B 样 条 模糊 神经 网 络 控制 器 的 设计 


在 了 B 样 条 网 络 的 设计 中 ， 设 计 者 必须 确定 两 个 参数 : 组 成 B 样 条 基 函 数 的 多 项 式 的 
阶 数 闫 以 及 单 变 量 了 B 样 条 函数 的 顶点 个 数 w， 由 此 可 求 得 单 变量 B 样 条 函数 所 需 的 节点 
数 ! = ww + 靖 。 对 应 于 模糊 袖 经 网 络 ， 阶 数 普 才 示 不 同形 状 的 隶属 函数 ， 当 严 = 工 时， 代 
表 三 角形 隶属 函数 ， 汉 赤 取 二 时 ， 代 表 二 次 型 隶属 函数 : 而 项 点数 N 对 应 于 模糊 标记 数 。 
节点 数 则 在 一 定 范围 内 决定 了 各 隶属 函数 的 宽度 〈 每 一 个 B 样 条 基 久 数落 在 * 轴 上 所 上 
节点 数 为 左 +1)。 

对 于 模糊 神经 网 络 控制 器 的 设计 ， 其 输入 变量 可 选 为 误差 e 和 误差 的 变化 ec。 若 取 
阶 数 me = mee = 3 顶点 数 凡 = Ne =5， 则 节点 数 上 = 如 =3+5=8&, 在 [-1.1 内 等 距离 取 值 ， 
由 此 可 得 网 络 控制 器 的 控制 量 we,ec) 的 计算 公式 为 : 
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eec Aieec 
Me,ec)= 忆 NR(eec KE = 之 有 te)Bec (ec 12.18) 
必 =1 大王 | 

其 中 , 所 =1，2，,…，z， 大 =1，2，...，me。 网 络 结构 如 略 12.3 所 示 。 

通过 训练 或 优化 算法 可 以 确定 (12.18) 式 中 的 权 值 参数 m。 然 而 由 于 用 于 训练 的 数据 
引 实际 上 是 无 法 知道 的 ， 为 此 ， 可 采用 于 闭环 的 间接 方式 ， 将 所 设计 的 控制 器 与 过 程 要 
联 ， 组 成 闭环 负 反馈 回路 ， 并 以 系统 参考 输入 作为 样本 输入 数据 ， 而 将 系统 输出 作为 实际 
输出 ， 以 两 者 之 间 的 误差 平方 和 为 最 小 作为 训练 的 目标 ， 并 采用 遗传 算法 优化 B 样 条 模 
糊 神经 网 络 控制 器 的 权 值 wx。 因为 需要 用 到 被 控 过 程 ， 所 以 被 控 过 程 模型 的 辨识 也 是 控 
制 器 设计 的 一 部 分 ， 并 在 优化 控制 权 值 ws 时 ， 假 定 所 辨识 的 过 程 参 数 是 正确 的 ， 且 保持 
不 变 。 在 我 们 的 实际 应 用 中 ，B 样 条 模糊 神经 网 络 控制 器 的 设计 过 程 是 在 MATLAB 环境 
下 进行 的 。 具 体 设计 过 程 如 下 : 

全 首先 获得 实际 被 控 过 程 的 一 组 输入 /输出 数据 ， 然 后 利用 神经 网 络 工具 包 对 被 控 过 
程 的 输入 /输出 进行 辨识 ; 


人 





ww 





AAAeec 


图 12.3 B 样 条 神经 网 络 结 构图 
人 包 根 据 召 样 条 工具 包 计算 (12.18) 式 中 的 控制 值 〈《 给 定 一 组 初始 权 值 wk0)): 
名将 控制 器 与 被 控 过 程 组 成 闭环 控制 系统 ， 并 计算 闭环 系统 的 输 嵌 值 ， 将 其 与 期 望 值 
的 误差 平方 和 作为 性 能 指标 《〈 适 配 值 ); 
地 根据 计算 出 的 适 配 值 ， 对 8 样 条 慌 糊 控制 器 中 的 权 值 w 进行 复制 、 交 换 和 变异 的 
遗传 操作 ， 以 不 断 地 优化 适 配 值 。 在 实际 设计 过 程 中 ， 种 群 数 取 为 40， 进 化 代数 为 100。 
变异 系数 是 随 着 进化 代数 的 增加 从 0.05 增加 到 0.12。 


12.6 径 向 基 函 数 神经 网 络 


对 于 直接 采用 前 向 网 络 实现 模糊 系统 所 存在 的 训练 时 间 长 ， 存 在 局 部 极 小 值 问题 ， 生 
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向 基 网 络 〔Radial Basis Funetion Networks， 人 入 称 RBF 网 络 》 在 很 大 程度 上 解决 了 上 述 问 
题 。RBF 网 络 不 存在 局 部 极 小 旧 问 题 ， 它 示 仅 有 具有 全 局 盘 近 性 能 ， 而 且 具 有 最 佳 逼 近 性 
能 ， 同 时 甚 训 练 方法 快速 易 行 ， 为 解决 模糊 褐 经 网 络 的 问题 提供 了 新 的 思路 。 

在 第 6 章 中 已 经 详细 介绍 了 RBPF 网 络 ， 它 的 结构 图 如 图 12.4 所 和 示 。 从 网 络 结构 上 看 ， 
RBF 网 络 含有 一 个 隐 含 层 ， 并 且 具 有 标准 全 连接 的 前 向 网 络 。 隐 含 屋 中 采用 径 向 基 函 数 
一 一 一 种 高 斯 型 指数 函数 ， 而 输出 层 采 用 线性 激活 函数 ， 由 此 会 使 人 感觉 似乎 RBF 网 络 
就 是 一 个 具有 径 向 基 函 数 的 BP 网 络 。 实 际 上 RBF 网 络 是 与 BP 网 络 完全 不同 的 网 络 ， 其 
原因 是 : 出 它 不 是 来 用 BP 算法 ， 即 误差 的 友 向 传 播 法 来 训练 网 络 权 值 的 : 多 其 训练 的 算 
法 不 是 梯度 下 降 法 。 昌 然 是 两 层 网 络 ， 径 向 基 爽 络 的 权 值 训练 是 一 层 一 屋 进行 的 。 在 对 径 


向 基层 中 的 权 值 进行 训练 时 ， 采 用 的 是 无 教师 训练 。 网 络 训练 的 目的 是 使 lw = P7 。 邯 
于 径 向 基 冰 数 在 将 其 输入 放置 在 函数 原点 时 输出 为 1， 而 对 其 他 不 同 的 输入 值 的 响应 均 小 
于 1， 所 以 权 俏 设计 的 目的 地 十 将 每 一 组 输入 值 P8 作为 一 个 径 向 基 函 数 的 原点 ， 而 权 值 

















Wl 代表 径 向 基 冰 数 中 心 的 位 置 ， 通 过 令 wls = P 使 等 一 个 径 向 基 函 数 只 对 一 组 PP 响应 ， 


从 而 迅速 辨识 出 Py 的 大 小 。 然 后 进行 输出 层 的 权 值 设计 。 由 于 输出 层 是 线性 函数 ， 网 络 


输出 是 径 向 基层 输出 的 线性 组 合 ， 从 而 很 容易 地 达到 了 从 非 线性 输入 空间 向 输出 空间 喘 射 
的 目的 。 理 论 上 已 经 证 明 ， 径 向 基 网 络 可 以 以 任意 精度 还 近 任 意 连 续 函 数 。 








(ay 径 向 基 网 络 fb) 广义 么 向 基 网 络 
图 12.4 径 问 基 网 络 结 攀 了 疼 


值得 指出 的 是 ， 由 于 径 向 基 网 络 的 权 值 算法 是 单 层 进 行 ， 并 且 采 用 每 一 个 w = Ps ， 


所 以 虽然 从 网 络 结构 图 中 看 上 去 网 络 丰 全 联接 ， 实 祭 上 工作 时 网 络 是 局 部 工作 的 ， 即 对 特 
一 组 和 输入， 网 络 只 有 一 个 神经 元 被 激活 。 其 他 神经 元 被 激活 的 程度 可 以 忽略 。 所 以 ， 径 向 
基 网 络 是 一 个 局 部 逼近 的 神经 网 络 。 正 是 因为 如 此 , 网 络 的 训练 速度 要 比 BP 网 络 快 上 1-2 
个 数量 级 。 这 是 径 向 基 网 络 的 最 大 优点 。 不 过 径 向 基 网 络 降 食 层 的 神经 元 往往 比较 多 ， 从 
上 曾 的 分 析 来 着 ， 它 的 数量 一 般 情 况 下 应 与 被 训练 的 输入 数组 @ 相等 。 当 训练 数组 很 多 
时 ， 采 用 径 向 基 网 络 可 能 不 大 赛 易 被 人 接受 。 
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对 此 缺点 采用 的 改进 算法 是 ， 在 满足 误 闫 目标 的 前 担 下， 尽量 减少 径 向 基层 中 的 神经 
元 数 。 上 具体 的 做 法 是 在 训练 时 从 一 个 节点 开始 训练 ， 通 过 检查 误 荆 旦 标 使 网 络 自动 增加 径 
向 基层 中 神经 元 的 节点 ， 每 次 循环 后 用 使 网 络 产生 最 大 误差 所 对 应 的 输入 矢量 产生 一 个 新 
的 径 向 基层 的 神经 元 ， 然 后 检查 新 网 络 的 误差 ， 重 复 此 过 程 直 到 达到 误差 目标 为 止 。 每 增 
加 一 个 径 向 基层 的 神经 元 ， 相 当 于 增加 了 一 条 模糊 现 则 ， 从 而 订 以 达到 在 线 调整 模糊 规则 
的 目的 。 

从 网 络 结 检 上 看 ， 得 个 径 向 基层 神经 元 的 输出 都 是 在 每 组 输入 值 作用 下 的 颖 果 ， 与 图 
12.1 所 表示 的 具有 异 糊 逻辑 推理 的 神经 网 络 结 梅 相 比 ，RBF 隐 络 中 的 径 向 基 网 络 就 起 到 
了 隶 届 函数 的 作用 ， 径 向 基层 厌 完 成 了 相当 于 图 !2.1 中 的 输入 层 加 上 中 间 层 所 完成 的 异 
确 推 理 功能 。 由 于 RBF 网 络 中 的 季 应 基层 是 全 连接 ， 所 以 通过 -- 层 殉 络 ， 对 所 有 的 输入 
变量 都 产 目 了 作用 ， 即 让 每 一 个 输入 变 旺 在 每 一 个 径 向 基 上 部 有 一 个 输出 。 径 向 基层 的 输 
出 即 为 所 有 输入 变量 共同 作用 的 综 人 台北 果 ， 其 值 为 一 组 0 一 1 之 间 的 数 ， 等 价 于 模糊 系统 
中 从 前 所 到 结论 所 获得 的 所 有 模糊 规则 数 。 由 此 可 山 ，RBEF 网 络 用 一 个 陷 含 层 起 到 了 普 
通 模糊 神经 隐 络 两 层 的 作用 。 由 于 层 数 的 减少 ， 简 化 了 结构 ， 而 且 因 其 训练 是 两 层 分 别 进 
行 ， 必 然 能 够 提高 训练 网 络 的 速度 。 另 外 ， 径 向 基 网 络 输出 层 的 激活 函数 是 线性 函数 ， 所 


以 其 网 络 输出 应 为 了 = 4 钱 2= 3 aimw2i ， 这 与 模 钴 神经 网 络 的 表达 式 〈12.6) 完全 相同 。 


这 说 明 ， 一 个 径 向 基 网 络 的 表达 式 所 代表 的 就 是 一 个 模糊 神经 网 络 系统 。 

另外 ， 与 B 样 条 网 络 相 比 较 可 以 发 现 ， 径 向 基 网 络 与 B 样 条 网 络 的 表达 内 容 完全 相 
同 ， 不 同 之 处 仅 在 于 前 者 用 径 向 幕 函 数 表 示 隶 属 函 数 ， 而 后 者 的 求 属 函 数 是 B 样 条 基 函 
数 。 

为 了 得 到 和 更 加 平滑 的 解 模糊 数值 ， 可 在 六 通 的 径 向 基 网 络 输出 后 加 上 一 个 求 加 权 平 均 
值 的 过 程 ， 如 图 12.4 (b) 所 示 ， 它 比 图 12.4〔〈al 中 才 了 一 个 除法 运算 符号 “/” 这 时 的 
网 络 输出 为 : 





_ 了 ai(Ppjne2i 
之 后 (四 

此 网 络 可 称 为 广义 短 向 基 网 络 〈 或 泛 化 回归 网 络 )。 

因为 ai 的 数值 为 0~ 的 指数 型 函数 输出 值 ， 伯 细 观 察 〈12.19) 式 ， 可 以 发 现 〈12.19) 
式 的 形式 与 《12.3) 式 采 用 质心 法 对 模糊 集合 进行 解 模糊 的 模糊 系统 的 输出 方式 完全 相同 ， 
只 是 在 广义 径 癌 基 网 络 中 采用 的 足 径 向 基 阔 数 ， 而 模糊 系统 中 是 某 一 形状 的 隶属 落 数 。 正 
是 由 于 这 种 径 同 基 形 状 画 数 的 作用 ， 使 广义 径 向 基 网 络 和 模糊 系统 都 具有 相同 的 对 局 部 输 
入 上 的 激励 在 一 个 小 的 接受 域内 上 闫 生 中 心 加 权 隐 应 的 机 理 。 两 着 虽然 是 基于 不 同 的 原理 发 
展 而 来 的 ， 但 是 都 达到 了 同一 目的 ， 只 是 广义 径 向 枯 网 络 具 有 较 快 的 收敛 速 度 ， 而 模糊 系 
统 能 够 民 映 出 更 多 数据 的 物理 特性 。 

完全 使 广义 径 向 基 阅 络 与 模糊 系统 等 价 ， 还 必须 满足 下 列 条 件 : 

CORBF 网 络 和 模糊 系统 必须 采用 相同 的 方法 〈 即 或 如 权 绊 均 法 或 加 枚 求 和 法 ) 产生 
其 输出 ; 

GORBF 网 络 中 接收 域 的 神经 元 个 数 等 于 模糊 系统 中 的 “如 果 一 那么 ”的 模糊 规则 数 ; 

人 RBF 网 络 中 的 每 一 个 径 向 基 函 数 等 于 模糊 系统 中 组 成 某 个 模糊 规则 的 多 维 隶 属 冰 
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《12.19) 








数 的 前 提 部 分 。 运 到 这 一 目的 方式 之 一 是 在 模糊 规则 中 采用 与 RBF 网 络 具 有 相交 的 但 差 
的 高 斯 型 隶属 函数 ， 并 应 用 点 积 米 产生 规则 强度 ， 从 而 使 这 些 高 斯 型 隶属 函数 的 乘积 变 成 
一 个 多 维 涡 斯 函数 一 RBF 网 络 中 的 一 个 径 向 基 函 数 ; 

GORBF 网 络 与 模糊 系统 应 当 对 应 有 相同 的 响应 函数 ， 即 它们 应 当 具 有 相同 的 常数 项 
《对 于 2 取 常 数 时 ， 对 应 替 阶 Susgeno 模 类 推理 系统 ， 当 了 到 


w2=co+clpl+czpz+…+tcenpntci 是 待 确定 和 常数) 时， 对 应 于 一 阶 Sugeno 模糊 推理 系 


统 )。 

综 上 所 述 ， 对 于 模糊 系统 的 实际 应 用 ， 采 用 广义 径 向 基 网 络 不 仅 在 隶属 函数 中 心 位 
置 、 宽 度 上 ， 而 且 对 模糊 规则 同时 给 予 优化 ， 妨 外 具有 相当 快 的 收敛 速度 。 其 不 足 是 在 一 
般 情况 下 需要 较 多 的 隐 合 层 的 神经 元 数 。 不 过 从 模糊 推理 过 程 可 以 得 知 ， 既 然 模糊 标记 数 
和 规则 数 体现 出 模糊 系统 的 精度 ,所 以 在 需要 较 高 精度 时 , 神经 元 数目 较 多 是 理所当然 的 ， 
更 何 沈 RBF 网 络 允 神经 元 数目 还 可 以 自动 寻 优 。 


12.7 小 结 


神经 网 络 具有 多 种 结构 和 学 习 算 法 ， 模 糊 逻 和 辑 推理 也 具有 多 种 形式 ， 本 章 从 多 方面 研 
究 了 在 用 神经 网 络 描述 模 糊 控制 的 过 程 中 ， 不 同 模糊 神经 网 络 之 间 的 等 价 特 人 性， 以 达到 根 
提 模 糊 推理 规则 来 构造 网 络 结构 ， 同 时 利用 神经 网 络 的 学 习 能 力 进 行 复杂 的 模糊 推 还 ， 提 
遇 运 算 速度 ， 达 到 对 权 值 自动 寻 优 的 目的 。 遂 过 对 不 同 结构 及 方式 的 异 灶 神 经 网 络 系统 关 
系 的 分 析 与 对 比 ， 更 加 深入 地 揭示 了 各 种 网 络 的 优 缺 点 ， 有 利于 更 好 地 选 搓 和 设计 网 络 。 
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第 13 章 模糊 神经 系统 的 应 用 


13.1 基于 ANFIS 的 非 线性 电机 系统 的 建 模 


80 年 代 中 期 以 来 ， 随 着 人 工 神经 网 络 研究 的 复兴 ， 在 许多 领域 取得 了 民 好 的 应 用 效 
果 。 非 线性 系统 的 建 模 、 辩 识 与 控制 是 其 中 的 重要 应 用 方向 。 研 究 表明 ， 对 于 非 线 性 系统 
而 言 ， 采 用 传统 的 分 析 方法 只 能 面向 特定 的 应 用 ， 而 不 存在 一 种 普遍 适用 的 方法 。 人 工 神 
经 网 络 以 其 出 色 的 非 线 性 映射 下 近 能 力 以 及 自学 习 能 力 为 非 线 性 系统 的 建 模 提 供 了 强 有 力 
的 工具 。 此 外 ， 随 着 对 模糊 推理 系统 研究 的 发 展 ， 使 其 不 仅 能 够 利用 专家 的 语言 知识 ， 还 
可 以 根据 给 定 的 数据 调整 参数 以 获得 良好 的 模糊 模 雹 。 近 年 来 ， 如 何 将 模糊 系统 的 知识 表 
达能 力 与 神经 网 络 的 学 习 能 力 结合 起 来 ， 是 备 爱 注目 的 课题 之 一 。 

本 章 将 省 重 介绍 采用 苦于 Takagi-Sugeno 模 塌 而 建立 的 自 适 应 神经 模糊 推理 系统 ( 简 
称 ANFIS)， 并 同时 对 一 个 非 线 人 性 电机 系统 进行 建 模 ， 其 主要 目的 是 进行 以 下 几 项 工作 : 
全 建 模 方法 的 对 比 。 将 采用 ANEFIS 和 反 向 传播 网 络 〔 简 称 BPNN ) 对 同一 系统 分 别 建 模 ， 
对 各 自 的 训练 速度 和 建 模 精度 进行 对 比 ; @@ 采 用 ANFIS 训练 所 建 模 型 与 实际 系统 之 间 进 
行 输入 /输出 数据 的 验证 以 及 泛 化 性 能 的 检验 。 

本 章 的 结构 安排 如 下 : 首先 简要 介绍 ANFIS 的 结构 及 参数 调整 的 算法 ， 然 后 进行 采 
用 ANFIS 建 模 的 实例 说 计 与 分 析 并 给 出 对 比 结 果 ， 最 后 给 出 小 结 。 








13. 1.1 ANFiS 的 结构 


由 Jyh-Shing R. Jang 提出 的 自 适 应 神经 模糊 推理 系统 ， 是 一 种 基于 Takagi-Sugeno 模 型 
“或 简称 Sugeno 懂 型 ) 的 懂 糊 推理 系统 。 研 究 表 明 ， 当 输入 模糊 集 采 用 非 梯形 / 非 三 角形 
的 隶属 国 数 时 ，Sugeno 模 糊 系统 比 玛 达 尼 和 模糊 系统 更 经 济 ， 即 需要 的 模糊 规则 及 输入 的 模 
糊 集 的 个 数 较 少 。 

一 个 具有 两 条 规则 的 简单 的 Sugeno 模 类 系统 ANEFIS 的 结构 如 下 : 


这 xisA4 andyis 号 then 六 =gX 十 而 ?十 品 








 . . 《13.1) 
这 xis4 andyis 六 then 户 =aox 二 有 术 了 十 Cs 
对 应 的 ANEFIS 结构 如 图 13.1 所 示 。 
需要 指出 的 是 ， 在 图 13.1 中 ， 世 点 间 的 连 线 仅 表 示 信 和 号 的 流向 ， 没 有 权 值 与 之 关联 ; 
方形 节点 表示 带 有 可 调 参数 的 节点 ， 圆 形 节 点 表示 不 带 有 可 调 参 数 的 节点 。 从 网 13.1 可 
见 ， 只 有 第 1 户 和 第 4 层 中 有 可 调 参 数 。 
各 层 的 功能 如 下 ;: 
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站 一 人 ， 


第 1 层 : 将 输入 变量 模糊 化 ， 输 出 对 应 模糊 集 的 隶属 度 ， 其 中 一 个 节点 的 传递 函数 可 
以 表示 为 : 
OL =AA 人 0) (13.2) 


layer 1] layer2 layer3 layer4 layer 3 





图 13.1 ANEFIS 结构 图 
根据 所 选择 的 隶属 函数 的 形式 ， 可 以 得 到 相应 的 参数 集 ， 称 为 条 件 参 数 。 例 如 ， 通 芝 
使 用 的 高 斯 隶属 函数 : 


行 ; 


2 
As (中 =ex -| (13.3) 
则 条 件 参 数 集 为 所 有 好 ,,d,} 的 集合 。 

第 2 层 : 实现 条 件 部 分 的 模糊 集 的 运算 ， 输 是 对 应 (13.1) 式 的 每 条 规则 的 适用 度 ， 通 
常 采用 雪 法 : 





OP =mwi = LA (oOxAa， (7 《13.4》 
第 3 层 : 对 各 条 规则 的 适用 度 进 行 归 一 化 处 理 。 
3 一 中; 
全 = 务 ; = 《13.52 
他 | 十 四， 


第 4 层 : 每 个 节点 的 传递 函数 为 线性 函 煞 ， 表 示 局 部 的 线性 模型 ， 计 算出 每 条 规则 的 
输出 : 
OH = 人 | 广 =oifaix 十 三 +cei) 《13.67 
由 所 有 世 ,, 忆 ,c; } 组 成 的 参数 集 称 为 结论 参数 。 
第 5 层 ; 计算 所 有 规则 的 输出 之 和 : 
二 i 太 


OO = 了 = 了 由 广 =- (13.7) 





从 以 上 网 络 的 输入 和 输出 之 间 的 关系 可 以 看 出 ， 图 13.1 所 示 的 网 络 与 〈13.1)》 式 所 表 
示 的 模糊 推理 系统 完全 等 价 。 模糊 推理 系统 的 参数 学 习 可 归结 为 对 条 件 参 数 ( 非 线 性 参数 ) 
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的 ee ， 


与 结论 参数 《线性 参数 ) 的 调整 。 





13. 1.2 混合 学 习 算 法 


对 于 所 有 参数 ， 均 可 以 采用 基于 梯度 下 降 的 反 向 传播 算法 来 调整 参数 。 这 里 对 ANFIS 
参数 的 训练 与 傅 定 ， 采用 一 种 湿 人 台 委 法 ， 共 目的 是 为 了 提高 学 习 的 速度 。 混 合算 法 中 条 件 
参数 仍 采 用 反 向 传播 算法 ， 厕 结论 参数 采用 线性 最 小 二 乘 估 计算 法 来 调整 参数 。 

根据 图 13.1 所 示 ANEFIS 系统 ， 系 统 输出 可 写 为 ， 





7 = 之 w 了 
= 六 页 (ax 十 鼎 》+ci) 《13.8) 


-全 侣 六 + 全 + 全 宫 + 区 少 + 全 上 


少 合 学 习 算法 的 步骤 如 下 : 

每 一 次 选 代 中 ， 输 入 信和 号 首先 沿 网 络 正 向 传递 直到 第 4 层 ， 此 时 固定 条 件 参 数 ， 采 用 
最 小 二 乘 佑 计算 法 调节 结论 参数 ; 然后 , 信号 继续 沿 网 络 正 向 传递 直到 输出 层 ( 即 第 5 层 )。 
此 后 ， 将 获 香 的 误差 信号 沿 网 络 反 向 传播 ， 从 而 可 调节 条 件 参数 。 

采用 泡 合 学 习 算法 ， 对 于 给 定 的 条 件 参数 ， 可 以 得 到 结论 参数 的 全 局 最 优 反 ， 这 样 不 
仅 可 以 降低 梯度 法 中 搜索 空间 的 维 数 ， 通 常 还 可 以 大 大 提 高 参数 的 收 敏 速度 。 





13. 1.3 非 线性 电机 系统 建 模 














下 面 ， 将 对 一 个 具有 非 线性 摩 操 力 影响 的 直流 电机 系统 进行 建 横 。 用 来 采集 输入 / 输 
出 信号 的 实际 控制 系统 包括 一 台 Pentium 200 计算 机 、 一 块 内 置 于 计算 机 的 12 位 A/D, DA 
转换 板 、PWM 功率 放大 电路 、 直 流 力矩 电动 机 以 及 用 于 速度 反馈 的 直流 测速 发 电机 。 模 
拟 电压 输入 范围 与 输出 控制 虫 扑 范围 均 为 [-$, 引 伏 ， 模 数 转换 后 的 数字 量 范 围 均 为 上 2048， 
2048]， 为 了 方便 起 见 ， 和 输入 和 和 输出 单位 均 采 用 数字 量 。 被 控 系 统 的 模型 包括 除 计算 机 外 
的 所 有 部 件 的 集合 。 在 5 毫秒 的 采样 周期 下 ， 和 输入 信号 持续 10 秒 ， 即 2000 个 采样 周期 。 
为 了 使 所 建 模型 对 各 种 不 同 的 输入 信号 者 具有 很 好 的 泛 化 能 力 ， 训 练 输 入 信号 采用 一 个 多 
频率 分 量 正 弦 的 复合 信号 : 








证 +300sin +400sin- 本 +340sin 开 +430sin 了 二 +320sin (13.9) 


z 人 (人 = 350sin 
1000 500 1000 125 





将 〈13.9) 式 的 信号 作为 实际 系统 的 输入 ， 获 得 电机 的 真实 输出 〈 即 转速 信 导 7。 实 际 
电机 的 输入 /输出 如 图 13.2 所 示 。 
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-二 ruaia 和 二 Hitak au Wi 本， .13 一 mm 一 





心 1000 


图 13.2 训练 用 输入 /输出 信号 


13.1.4 基于 ANFIS 的 建 模 


在 13.1.2 节 中 ， 口 经 介绍 了 ANEFIS 的 结构 及 算法 ， 但 未 提 及 ANFIS 中 参数 的 初 冶 化 
问题 。 通 常 结论 参数 初始 值 为 符 ， 故 初始 化 问题 主要 在 于 条 件 参 数 。 条 件 参 数 的 初始 化 ， 
决定 了 输入 空间 的 分 割 ， 从 而 次 定 模糊 规则 的 数目 。 通 常 输入 空间 的 分 割 可 以 采取 平均 分 
割 法 或 采用 模糊 到 类 方法 。 

首先 ， 假 设 电机 模型 为 一 阶 系 统 ， 即 输入 /输出 关系 式 可 以 表示 为 : 


7J= OO 人 -Tu 伙 - 荡 《13.10) 


我 们 采用 平均 分 割 法 ， 对 三 与 二 大) 均 将 各 自 的 输入 区 间 等 分 为 3 部 分 ， 模 糊 素 
属 函 数 均 选 用 高 斯 型 。 这 样 ， 两 个 输入 总 共 形 成 9 种 组 合 ， 即 存在 9 条 模糊 规则 。 根 据 前 
面 的 分 析 可 知 ， 条 件 参数 共有 12 个 〈3*2+3+*2)， 结 论 参 数 共 有 27 个 〈g#*3)。 由 此 下 构造 
一 个 输入 为 zf D 和 EL1)， 输 出 为 XD， 模 糊 标记 数 为 3， 即 = 3 的 ANFIS 模糊 神经 建 
模 系 统 。 实 际 系统 的 输出 与 模型 输出 之 间 的 均 方 差 MSE 作为 网 络 训练 的 指标 。 经 过 100 
次 达 代 ，ANEIS 与 实际 系统 之 间 的 对 比 结果 如 图 13.3 所 示 ， 网 络 训练 后 的 均 方 误差 WMS = 
4.9854。 

作为 对 比 ， 同 时 采用 一 个 2-10-1 的 反 向 传播 神经 网 络 〈《BPNN) 对 同样 的 数据 组 进行 
建 横 。 此 时 网 络 共 有 41《10* els2 + 10*b1 + 10* Go + 82) 个 参数 (而 ANFIS 只 有 39 个 参 
数 ?。 对 于 BPNN 的 训练 ， 采 用 收敛 速度 和 训练 效率 相当 好 的 Levenberg-Marquardt 算法 。 
这 一 算法 收 化 速度 较 普通 的 梯度 下 降 法 快 得 多 ， 且 和 迭代 次 数 少 很 多 。 经 过 1000 次 选 代 ， 
BPNN 的 训练 结果 的 均 方 误差 MsSE = 5.1516。 而 采用 ANFIS 建 模 ， 达 到 相同 的 精度 ， 选 
代 次 数 只 需 前 者 的 十 分 之 一 。 

通过 实验 发 现 ，ANEIS 第 一 次 选 代 后 即 可 得 到 很 好 的 结果 而 采用 BPNN 在 前 几 十 
次 选 代 中 ， 所 有 具有 的 误差 都 一 直 比 较 大 。 虽 然 其 MSR 随 迭 代 次 数 的 增加 有 显著 下 降 ， 但 


其 效果 仍 不 如 ANFIS。 这 是 因为 ANFIS 的 条 件 参 数 在 初始 化 时 采用 的 是 平均 分 割 法 ， 相 
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当 于 把 输入 空间 分 成 多 个 区 域 ， 与 BPNN 参数 初始 化 的 随机 性 相 比 ， 这 一 方法 更 加 合乎 
情理 ;此 外 ，ANEFIS 实际 上 是 山 多 个 局 部 映射 组 合 而 成 的 ， 并 且 每 个 局 部 胸 射 的 参数 【〈 邵 
结论 参数 ) 采用 线性 最 小 二 乘 估计 算法 ， 这 就 使 得 它 的 收 和 化 速度 比 采 用 反 向 传播 算法 的 
BPNN 快 得 多 。 总 之 ，ANFIS 从 初始 化 和 学 习 算 法 两 个 方面 保证 了 比 BPNN 更 快 的 收敛 
速度 。 





输入 与 输出 【数字 基 》 
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《b) 守 际 系统 输出 与 模型 输出 之 间 的 误差 
图 13.3 ANRFIS 与 实际 系统 之 间 的 对 比 结 时 


13. 1.5 辨识 模型 的 验证 


本 节 对 于 所 辨识 出 的 网 络 模型 进行 验证 。 首 先 ， 同 样 采用 一 个 在 幅 值 和 频率 上 都 有 恋 
化 的 多 频率 分 量 正弦 信号 作为 测试 信号 : 
。 大 兢 加 ， 大 刘 ， KK KT 开交 
=350sin 一 一 一 一 一 一 一 一 in 一 一 in -一 
H 人 ] 1000+ ”0in500+450sin200+300sin100+ 450sin50+300sin 50 【13.11 
对 所 建 的 非 线性 模型 进行 测试 。 测 量 到 的 实际 系统 与 模型 输出 的 结果 如 图 13.4 所 示 ， 
均 方 误 兰 为 14S 瑟 = 6.5836。 





图 13.4 攻 统 及 模型 分 别 对 多 频 输 入 信号 的 响应 曲线 
其 次 ， 测 斌 被 建 横 系 统 所 有 具有 的 两 种 典型 的 非 线 性 特性 ， 饱 和 与 死 区 。 分 别 采 用 两 个 
单 频率 的 正 苹 信号 作为 测试 信号 〔 见 〈13.12a) 式 与 人 13.12b) 式 ) 输入 给 所 建 模 型 ， 同 
时 和 输入 给 实际 系统 ， 从 实际 系统 及 所 建 测 试 模型 所 获 的 输出 及 输入 信和 号 分 别 如 图 13.5 和 


图 13.6 所 示 。 








到 开 
才 )=100085i 13.12 
人 ) si {《 a) 
才 邢 
天 = 4008Sin 13.12b 
zx 做) in Ta ) 





采样 周 詹 数 
图 13.s 非 线 性 饱和 特 竹 的 验证 (MSE=-5 .461) 
从 实际 系统 和 输出 与 所 建 模型 的 输出 可 以 看 出 ， 在 2000 个 采样 点 的 数 活 中 所 有 具有 的 误 
差 平 方 和 均 在 7 以 内 ， 可 见 其 精度 之 高 。 从 图 中 也 可 以 看 出 实际 输出 与 模型 输出 几乎 重合 
为 一 条 而 线 。 


dear - 





”站 1000 


2000 
采样 周期 数 


岛 13.6 非 线性 死 区 特性 的 验证 CMSE=1.9406) 
由 以 上 测试 可 以 看 出 ， 所 建立 的 ANEFIS 模型 不 仅 计 以 很 好 地 适应 幅 值 与 频率 的 变化 ， 
而 且 能 够 很 好 地 包含 电机 系统 的 非 线 性 特性 。 所 建立 的 模型 在 训练 信号 所 在 的 范围 内 对 幅 
廿 与 频率 的 改变 有 很 强 的 适应 性 ， 达 到 了 动态 精确 建 模 的 目的 。 


13. 1.6 小 结 


本 节 采 用 ANFIS 对 一 个 砷 线性 电机 系统 建 贷 ， 获 得 了 一 个 适应 范围 很 大 的 全 局 非 线 
性 动态 模型 。 通 过 与 BPNN 的 比较 ， 说 明 ANFIS 的 主要 优点 在 于 收敛 速度 很 快 ， 收 敛 时 
间 只 需 BPNN 的 十 分 之 一 ， 而 当 而 对 复杂 系统 时 ， 建 模 所 需 参数 急剧 增多 ， 收 北 速 度 显 
得 至 关 重 要 ， 此 时 ANEFIS 则 比 BPNN 最 示 出 更 大 的 优越 性 。 同 时 ， 在 对 实验 结果 的 分 析 
中 ， 半 明了 ANFIS 从 初始 化 和 学 习 算 法 两 个 方面 保证 了 比 BPNN 更 快 的 收 敏 速度 的 原因 。 
此 外 ，ANRFIS 本 质 上 是 一 个 基于 网 络 结构 的 模糊 推理 系统 ， 使 其 具有 比 BPNN 更 好 的 知 
识 表达 能 力 。 在 实际 应 用 中 ，ANFIS 为 非 线性 系统 的 建 模 、 办 识 以 及 时 间 序 列 分 析 提 供 
了 有 力 的 工具 。 


13.2 用 自 组 织 竞争 网 络 优 化 模糊 神经 网 络 的 结构 


神经 网 络 与 模糊 逻辑 控制 相 结合 的 研究 已 受到 人 们 的 广泛 注意 ， 通 过 神经 网 络 所 实现 
的 模糊 逻辑 控制 器 的 结构 具有 模糊 逻辑 推理 功能 ， 同 时 网 络 的 权 值 也 县 有 明确 的 模糊 逻辑 
意义 。 以 此 方式 ， 用 各 自 的 优点 弥补 对 方 的 不 足 ， 可 以 达到 最 佳 的 设计 效果 。 不 过 ， 不 论 
采用 何 种 训练 方法 , 所 获得 的 权 值 , 仅仅 是 模糊 神经 网 络 结构 在 事先 国定 的 情况 下 的 最 优 ， 
代表 模糊 标记 ( 即 : 正 小 、 负 大 等 等 ) 的 权 值 的 数目 是 由 设计 潭 在 训练 之 前 就 己 选 定 的 ， 而 
这 个 数目 为 党 少 经 常 是 根据 设计 者 的 经 验 或 是 由 误差 精度 的 要 求 来 确定 的 ， 很 明显 很 难 选 
得 一 个 最 优 值 或 称 最 小 值 ， 若 此 模糊 标记 的 数 选 得 太 小 ， 则 很 难 达 到 期 望 的 目标 ， 考 选 得 
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太太 ， 网 络 输出 屋 的 模糊 控制 规则 数 将 以 指数 形式 增加 ， 这 必然 造成 庞大 的 网 络 结构 ， 给 
权 介 的 训练 及 网 络 的 实现 均 带 米 不 便 。 

本 节 给 出 一 种 解决 此 问题 的 说 计 新 方法 。 为 了 获得 同时 有 具有 最 佳 结 构 和 参数 的 模糊 神 
经 网 络 (Fuzzy-Neural Network， 简称 FNINm， 运 用 自 组 织 竞争 神经 网 络 (Self-Organization 
Competition Neural Network， 简 称 SCNN) 优化 网 络 结构 。 其 设计 过 程 分 成 三 步 ， 
首先 ， 设 计 一 个 具有 较 多 权 值 的 模糊 神经 网 络 ， 并 确定 其 模糊 标记 数 ( 比 如 选 7 个 )， 
然后 ， 通 过 训练 优化 其 权 但 ; 

第 二 步 ， 选 取 模 糊 神 经 网 络 中 代表 模糊 求 属 函 数 的 权 值 (包括 偏差 ) 作 为 自 组 织 竞争 神 
经 了 网络 的 输入 矢量 。 通 过 该 网 络 的 竞争 与 训练 过 程 ， 将 这 些 输入 舌 量 的 相同 的 类 别 自动 组 
合成 若 于 组 ， 竞 争 后 所 获得 的 组 合 数 将 成 为 模糊 神经 网 络 的 最 佳 模糊 标记 数 ， 以 此 方式 将 
模糊 标记 的 数目 减少 到 最 小 ; 

最 后 ， 重 新 训练 由 第 二 步 竞 争 出 的 最 小 模糊 标记 的 FNN 权 值 。 





13. 2. 1 自 组 织 竞争 神经 网 络 


自 组 织 竞争 神经 网 络 旦 基于 生物 结构 和 现象 形成 的 ， 它 能 够 对 输入 模式 进行 自 组 织 训 
练 和 判断 ， 将 其 最 终 分 为 不 同 的 类 型 。SCNN 权 值 的 修正 采用 的 是 Kohonen 规则 ， 该 学 
习 规 则 羽 对 与 竞争 屋 获胜 节点 相连 的 权 值 进行 修正 ， 修 正 的 目的 是 使 输入 矢量 与 权 值 之 间 
的 误差 趋 于 0， 以 致使 网 络 的 权 值 在 竞争 与 训练 结束 后 ， 能 够 代表 输入 舌 量 ， 并 用 输出 值 
对 应 其 种 类。 输入 天 量 之 间 的 相似 性 ， 是 由 事先 选 定 的 偏 莽 值 少 来 控制 的 。 竞 争 层 的 神经 
元 数 (节点 ) r 是 由 设计 者 确定 的 ， 它 代表 输入 矢量 可 能 被 划分 的 种 类 数 。 

考虑 输入 矢量 成,。，SCNN 的 训练 过 程 如 下 ， 

MD 计算 : 计算 每 一 个 竞争 层 节 点 的 加 权 输 入 总 和 到; 


= Wi 十 下 2 二 12 天 13.13) 
| 


二 得 


名 竞 委 : 竞争 层 中 加 权 输 入 总 和 值 为 最 大 的 节点 为 获胜 节点 ， 假 定 获胜 节点 为 第 ! 
个 ，!ef7]， 则 有 : 


到 一 TaX 人 BE 一 1,2.7) {13.14) 
对 于 输出 节点 宇 有 下 式 成 立 : 
1， 如 果 ， ti=! 
芭 | 其 他 (13.1S) 


他 修 正 权 值 : 修正 与 获胜 节点 相连 的 权 值 ， 其 他 权 值 保持 不 变 ， 根 据 Kohonen 规则 ， 
有 : 


Auwy = 人 (xc 一 )， 二 十 Anwy 13.16) 


其 中 ，7 是 学 习 速率 ，x， 为 经 过 归 一 化 处 理 的 输入 矢量 : 


_ _ 
x 了 =12.. (13.17) 


六 元 ， 
了 
了 区 
Al 


轩 循 环 : 再 次 计算 新 的 加 权 输 入 矢量 和 ， 重 复 进行 竞争 与 权 值 的 修正 过 程 ， 直 到 达 
到 预选 定 的 循环 总 数 六 时 停 上 训练 。 

因为 只 有 与 获胜 节点 相连 的 权 值 才能 得 以 修正 ， 所 以 随 着 竞争 与 训练 过 程 的 重复 ， 那 
些 被 修正 的 权 值 则 越 来 越 趋向 于 它们 的 输入 矢量 ， 此 趋势 从 方程 (13.16) 中 也 可 以 推导 出 
当 Wi; = 时 ，Aw=0。 而 那些 获胜 节点 ， 在 当 另 一 个 相似 的 输入 秋 量 出 现时 《只 要 此 输 
入 矢量 与 已 获胜 的 输入 矢量 之 间 的 假 差 小 于 设 定 偏差 值 p)， 仍 然 能 够 获胜 。 而 当 一 个 具 
有 大 于 “偏差 的 输入 矢量 出 现时 ， 此 和 输入 节点 不 能 取胜 ， 但 定 有 另 一 个 节点 能 够 获胜 ， 这 
个 输入 矢量 则 属于 另 一 类 。SCNN 的 整个 训练 过 程 实际 上 就 是 一 个 将 输入 矢量 划分 成 车 于 
类 的 过 程 ， 使 相似 的 输入 变 成 一 类 ,相同 类 具有 相同 权 值 ， 从 而 降低 了 输入 和 泉 量 的 种 类 数 。 


13. 2.2 具有 最 佳 结 构 与 参数 的 模糊 神经 网 络 控制 器 的 设计 


为 了 展现 模糊 神经 网 络 !'h SCNHN 的 作用 ， 在 此 将 所 提出 的 方法 应 用 到 一 个 模糊 神经 
网 络 (FENN) 控制 器 的 设计 中 ， 其 控制 器 的 设计 是 用 来 控制 一 个 具有 高 度 非 线性 摩擦 力 影 
响 的 直流 伺服 电机 的 速度 跟踪 系统 ， 控 制 目 的 是 为 了 消除 非 线性 摩 括 力 所 引起 的 死 区 ， 并 
精确 地 跟踪 参考 输入 。 

IJ FNN 控制 器 的 设计 

首先 ， 设 计 一 个 具有 7 个 模糊 标记 ， 即 具有 49 个 控制 规则 的 FNN 控制 器 ， 网 络 结构 
如 图 13.7 所 示 。 可 以 看 出 它 是 一 个 具有 输入 请 、 中 间 层 和 输出 层 的 三 层 神经 网 络 。 在 功 





图 13. 7 模糊 神经 网 络 控制 器 的 结构 图 
能 上 ， 该 网 络 的 三 层 节点 是 严格 对 应 于 模糊 逻辑 控制 的 模糊 化 、 规 则 推理 和 道 模糊 三 个 步 
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又 的 ， 因 而 具有 明确 的 模糊 逻辑 意义 。 首 先 ， 网 络 输 入 变量 为 误差 e 和 误差 变化 ec; 其 
次 ， 输 入 层 节点 的 转移 函数 代表 的 恰 为 模糊 变量 的 隶属 函数 。 该 层 的 权重 值 v 和 6 的 不 


同 也 就 意味 着 变化 多 端的 隶属 函数 的 形状 和 位 置 。 该 层 的 输出 了 代表 的 就 是 模糊 化 的 结 
时 一 来 属 度 。 再 者 ， 中 和 间 层 是 将 模糊 化 得 到 的 求 属 度 两 两 相 乘 的 功能 。 中 间 层 的 输出 代表 
着 模糊 规则 的 规则 强度 ， 将 这 些 强度 传递 给 下 一 层 就 可 以 进行 着 模 糊 了 。 最 后 ， 输 出 层 的 
各 个 权重 值 2 代表 了 模糊 规则 ， 根 据 重 心 法 的 逆 模 糊 方 式 ， 只 要 将 它们 作为 权重 值 与 输 
入 ， 即 规则 强度 加 权 求 和 ， 答 出 即 为 模糊 控制 的 输出 量 。 

总 的 来 说 ，FNN 的 输入 /输出 关系 可 以 归结 如 下 ，: 


半 =[eec] (13.18) 

y 几 =exp[-(n 由 .1 +67)] {13.19) 

= -exp 人 + 抑 + 多.+62)]] 413.20) 

xz = 多 GO.YCO = 六 所 (13.21 
上 =1 


其 中 , j) = 82 1=i 了 囊 和 = 和 12.rli 天 = 1 2…,rlxrly rl 为 模糊 标记 数 。 

为 了 获得 最 优 网 络 权 值 以 及 期 望 的 闭环 控制 精度 ， 采 用 间接 法 对 权 值 进行 训练 ， 即 将 
控制 器 与 被 控 过 程 串 联 起 来 ， 并 形成 一 个 负 反 馈 控 制 回 路 ， 将 参数 输入 与 闭环 回路 的 输出 
之 闻 差 的 平方 和 作为 县 标 函 数 ， 以 保证 总 体 最 优 的 质量 。 另 外 考虑 到 反 向 传播 法 训练 权 值 
的 费时 以 及 有 陷入 局 部 极 小 值 的 不 足 ， 可 采用 改进 的 遗传 法 来 优化 权 值 。 

2) 录用 SCNN 优化 模 标 记 数 

对 于 上 述 具 有 了 个 模糊 标记 的 模糊 神经 网 络 ， 在 总 共 77 个 参数 中 ， 有 28 个 权 值 和 偏 
差 代 表 不 同 输入 的 隶属 函数 。 它 们 可 以 被 分 为 两 组 : 一 组 由 误差 变量 e 的 7 个 权 值 和 7 了 个 
偏差 组 成 , 另 一 组 包含 误差 的 变化 变量 ec 的 7 个 权利 和 7 个 偏差 值 。 现 在 将 这 两 组 为 SCNN 
的 输入 矢量 竞争 层 的 节点 数 选 为 5， 最 大 循环 数 w = 500， 相 似 度 偏 差 问 = -0.9。 在 对 输入 
矢量 归 一 化 处 理 后， 开始 进行 竞争 和 权 值 的 训练 ， 竟 争 学 习 规则 如 节点 所 述 ， 训 练 目标 是 
使 相似 的 输入 矢量 聚 成 同一 类 型 ， 以 达到 减少 输入 矢量 数组 的 目的 。 所 有 的 设计 与 训练 程 
序 均 由 MATLAB 及 其 中 的 神经 网 络 工具 包 完 成 。 

图 13.8 给 出 了 竞争 和 训练 之 后 的 输入 与 SCNN 权 值 矢量 的 分 布 图 、 其 中 “ 线 ” 表 示 
输入 矢量 ,“+” 代 表 权 值 矢量 值 ， 因 为 参数 被 归 一 化 处 理 ， 所 以 输入 矢量 具有 单位 模 数 ， 
所 有 的 输入 矢量 值 均 落 在 单位 贺 局 上 。 从 图 13.8 可 以 看 出 ， 通 过 竞争 后 ， 由 4 个 权 值 代 
替 了 7 个 输入 矢量 ， 事 先 设置 的 5 个 权 值 矢量 中 还 多 出 一 个 。 

按照 一 般 的 概念 ， 通 常 模糊 标记 的 数 日 的 选择 是 单数 ， 且 最 小 数 应 当 取 3: 负 、 零 和 
正 ， 而 此 处 在 经 过 竞争 训练 后 为 什么 对 所 研究 的 问题 给 出 了 4 个 标记 数 ? 为 了 回答 这 个 问 
题 ， 同 时 为 了 比较 ， 对 县 有 3 个 模糊 标记 数 的 模糊 神经 网 络 控制 器 也 进行 了 训练 设计 ， 同 
样 采用 改进 的 遗传 算法 优化 网 络 权 值 。 不 幸 的 是， 不论 如 何 训练 网 络 ， 不 能 达到 期 望 的 误 
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Er 





差 值 ， 控 制 系统 也 不 能 跟踪 输入 信 届 ， 几 13.9 (a) 给 出 了 训练 后 所 得 到 的 一 种 情况 ， 能 
够 很 好 地 跟踪 正 同 参考 和 输入。 而 负 向 跟踪 产生 较 大 误差 时 的 隶属 函数 曲线 ， 图 13.9 (b) 
和 (ec) 分 别 为 模糊 标记 为 4 和 7 时 的 录 属 函数 曲线 。 比 较 三 者 可 以 看 出 ， 不 论 选取 几 个 
模糊 标记 ， 总 存在 一 条 平坦 的 求 属 函 数 曲 线 ， 此 隶属 函数 是 用 娄 克 服 被 控 过 程 中 存在 的 非 
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图 13.8 输入 矢量 ( 线 ) 和 权 值 矢量 (+) 的 分 布 图 








te) 如 为 了 时 的 隶属 函数 
13.9 素 属 函数 曲线 
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线性 摩擦 力 。 当 模糊 标记 数 为 3 时 ， 除 了 ~ 个 用 于 非 线性 补偿 外 ， 只 翻 下 两 个 可 以 用 来 控 
制 动 力学 特性 ， 很 明显 起 不 够 的 ， 从 图 13.9〈a) 中 可 以 看 出 ，ec 中 只 有 一 个 正和 零 的 隶 
属 函 妆 ， 然 而 没有 表示 负 的 求 属 函 数 ， 所 以 系统 不 能 很 好 地 跟踪 负 向 信号 ， 而 当 模 类 标 记 
煞 为 4 时 ， 如 图 13.9 bpb) 所 示 ， 一 个 用 来 消除 非 线性 摩擦 力 ， 三 个 用 来 分 别 跟踪 负 、 零 
和 正 向 信号 ， 以 达到 最 佳 控 制 效果 ， 当 模 烤 标记 数 多 于 4， 那 么 多 余 的 隶属 函数 或 出 现在 
3 个 主要 的 隶属 函数 附近 ， 或 协助 克服 非 线 性 ， 所 有 这 些 多 余 的 “曲线 ” 均 能 通过 SCNN 
的 训练 丙 被 4 条 来 属 函 数 代 葵 。 

在 通过 SCNN 的 竞争 和 训练 后 ， 获 得 最 小 的 模糊 目标 的 数目 ， 然 后 ， 用 4 个 模糊 标 
记 重 新 构成 一 个 新 的 模糊 神经 网 络 ， 并 下 再 次 应 用 上 述 同 样 的 过 程 训练 出 网 络 权 值 。 

图 13.10 给 出 速度 跟踪 系统 在 模糊 神经 网 络 控制 器 作用 下 ， 对 梯形 输入 信号 的 响应 ， 
其 中 ,图 13.10 (a) 通过 SCNN 训练 结果 获得 的 具有 4 个 以 及 原 有 7 个 模糊 记 称 的 模糊 
神经 网 络 控制 器 的 响应 信号 ， 图 13.10 (b) 为 其 响应 误差 信号 ， 其 中 实 线 为 具有 4 个 模 精 
标记 的 FNN 控制 器 的 误差 。 从 图 中 可 以 看 出 ， 两 个 控制 系统 具有 完全 相同 的 跟 巾 输入 信 
号 能 力 ， 这 意味 着 : 前 者 下 以 取代 后 者 ， 同 时 也 是 最 小 数 日 和 最 简 结 构 ， 因 为 当 其 数 上 小 
于 4 时 ， 横 糊 神 经 网 络 控制 器 不 能 很 好 地 工作 。 所 以 可 以 说 ， 由 通过 SCNN 的 训练 所 获 
得 的 模糊 标记 数 所 组 成 的 模糊 神经 网 络 结构 及 其 训练 出 的 权 值 具有 最 优 结构 与 权 值 。 
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图 13. 10 输入 信号 与 不 同情 况 下 的 控制 系统 哟 应 (a) 与 误差 信和 导 (b) 


13. 2.3 小 结 


本 音 结 合 SCNN 训练 党 争 出 最 佳 模糊 标记 数 ， 以 及 改进 的 遗传 算法 优化 网 络 的 权 值 ， 
提出 一 种 设计 模糊 神经 网 络 最 佳 结构 与 权 值 的 方法 。 竞 争 训 练 前 后 的 隶属 函数 的 对 比 以 及 
控制 效果 的 对 比 都 证 明了 所 提 方 法 的 有 效 性 。 
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第 14 章 遗传 算法 


19 世纪 50 年 代 ， 英 国生 物 学 家 达尔 文 〈《C. R. Darwin，1809 ~ 1882) 根 据 他 对 世界 各 
地 生活 的 考察 资料 和 人 人工 选择 的 实验 ， 提 出 了 生物 进化 论 。 自 然 选 择 学 说 是 达尔 文 进 化 论 
的 中 心 内 容 。1859 年 达尔 文 发 表 《 物 种 起 流 》 巨 著 ， 提 出 了 以 自然 选择 为 基础 的 生物 进 
化 论 学 说 。 

根据 达 杀 文 的 进化 论 ， 生 物 发 展 进化 主要 有 三 个 原因 ， 就 是 遗传 、 变 异 和 选择 。 遗 传 
就 是 子 代 总 是 和 父 代 相似 ， 踪 传人 性 是 一 切 事 物 所 共有 的 特性 ， 正 是 这 种 遗传 性 ， 使 得 生物 
能 够 把 它 的 特性 、 性 状 传 给 后 代 ， 在 后 代 中 保持 相似 。 现 代 遗 传 学 研究 表明 ， 生 物 具有 遗 
传 性 是 生物 都 具有 录 传 的 基础 ， 遗 传 学 的 建立 和 发 展 有 力 推动 了 进化 论 ， 所 以 说 ， 遗 传 是 
生物 进化 的 基础 ， 变 异 是 指 子 代 与 父 代 有 革 些 不 相似 的 现象 ， 即 子 代 永远 不 会 和 父 代 完全 
一 样 。 变 异 是 一 切 生 物 所 具有 的 共同 特征 ， 是 生物 个 体 之 间 相 互 区 别 的 基础 。 引 起 变异 的 
原因 主要 是 生活 条 件 的 影响 、 器 官 使 用 的 不 同 及 杂交 。 生 物 的 变异 竹 为 生物 的 进化 和 发 展 
创造 了 条 件 。 选 择 决定 生物 进化 的 方向 ， 所 谓 选 择 是 指 保 留 和 海 汰 的 意思 。 选 择 分 为 人 工 
远 择 和 自然 选择 ， 人 工 选 择 是 在 人 为 环境 下 ， 把 对 人 有 利 的 生物 保 窗 下 米 ， 对 人 体 不 利 的 
个 体 被 澳 汰 。 和 良 然 选 择 就 是 指 生 物 在 自然 界 的 生存 环境 中 适 者 生存 , 不 适 者 被 淘汰 的 过 程 。 
世界 上 所 有 形形色色 的 生物 ， 部 是 在 自然 选择 的 影响 下 ， 在 悠久 的 岁月 中 形成 的 。 自 然 选 
择 的 过 程 症 通过 生存 斗争 的 过 程 来 实现 ， 生 存 斗 争 的 结果 ， 优 存 劣 汰 ， 这 桩 就 保存 那些 适 
应 环境 、 有 利于 生存 的 变异 。 通 过 不 断 的 自然 选择 ， 这 些 有 利于 生存 的 变异 就 遗传 下 歧 ， 
积累 起 来 ， 使 变异 越 来 起 大， 逐步 产生 新 的 物种 。 

总 之 ， 生 物 就 是 在 遗传 、 变 便 与 选择 三 种 因素 的 综合 作用 过 程 中 ， 不 断 地 向 前 发 展 和 
进化 。 选 择 是 通过 遗传 和 变异 起 作用 的 ， 变 异 为 选择 提供 资料 ， 过 传 巩固 与 积累 选择 的 资 
料 ， 而 选择 则 能 控制 变异 和 遗传 的 方向 ， 使 变异 和 遗传 向 着 适应 环境 方向 发 展 。 这 样 ， 生 
物 束 会 从 简单 到 复杂 ， 从 低级 到 高 级 不 断 地 疝 前 进化 和 发 展 。 

自然 选择 学 说 能 够 正确 地 解释 生物 界 的 自然 现象 一 一 多 样 人 性 和 适应 性 ， 这 对 于 人 们 正 
确认 识 生物 界 具 有 重要 意义 。 生 物 进 化 论 扬 示 了 生物 长 期 良 然 选 择 的 进化 的 发 展 规律 ， 使 
科学 家 们 从 中 受到 了 启迪 ， 认 识 到 进化 论 、 自 然 选择 过 程 草 含 着 一 种 搜索 和 全 化 的 先进 思 
想 ， 并 将 这 种 思想 用 于 工程 技术 领域 ， 发 展 出 遗传 算法 ， 为 解决 许多 传统 的 优化 方法 难以 
解决 的 优化 问题 担 供 了 轩 新 的 途径 。 

进 传 算法 〈Genetic Algorithm， 简 称 GA) 是 建立 在 自然 选择 和 自然 遗传 学 机 理 基础 
上 的 选 代 自 适应 概率 性 搜索 算法 。 该 算法 最 早 是 由 美国 的 二 H.Holland 教授 1975 年 发 表 的 
论文 “自然 和 人 工 系统 的 适 配 ” 中 提出 的 一 种 模仿 生物 进化 过 程 的 最 优化 方法 ， 它 模拟 了 
自然 选择 和 自然 遗传 过 程 中 发 生 的 繁殖 、 交 换 、 变 异 现象 ， 它 根据 适 者 生存 、 优 胜 劣 汰 的 
自然 法 则 利用 超 传 算 子 : 选择 、 交 义 、 变 异 乏 代 产 生 、 优选 个 体 ， 最 终 搜索 到 较 优 的 个 体 。 
具有 不 需要 求 梯度 、 能 得 到 全 局 最 优 解 、 算 法 简单 、 可 并 行 处 再 等 优点 ， 遗 传 算法 已 成 功 
应 用 于 各 种 复杂 问题 的 优化 中 ， 在 许多 传统 优化 技术 难以 解决 的 场 含 更 显示 出 其 优越 性 。 
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80 年 代 以 来 已 成 功 地 应 用 在 机 器 学 习 和 复杂 的 函数 优化 等 许多 领域 。 近 儿 年 米 ， 并 行 分 
布 处 理 的 发 展 使 人 们 看 到 了 遗传 算法 潜在 的 价值 。 

在 将 遗传 算法 应 用 于 实际 问题 之 前 ， 普 先 必须 将 待 优 化 的 参数 进行 编码 。 一 般 的 说 ， 
总 是 用 二 进 制 将 参数 编码 成 0 与 1 组 成 的 有 限 长 度 的 字符 串 ， 该 字符 串 称 为 染色 体 ， 其 中 
的 每 个 字符 称 为 基因 。 但 是 也 可 根据 实际 问题 的 需要 选择 其 他 的 编码 方法 。 另 外 由 于 遗传 
算法 利用 群体 中 短 个 个 体 的 优 劣 信息 进行 搜索 ， 因 而 必须 根据 优化 目标 对 每 个 全 体 进 行 评 
价 ， 侈 定 一 个 性 能 指标 ， 该 指标 被 称 为 适 配 度 。 遗 传 算法 涛 于 生物 遗传 学 ， 其 中 很 多 术语 
是 从 遗传 学 中 借用 过 来 的 。 表 引 .1 列 出 一 些 常 用 的 遗传 学 术语 与 遗传 算法 术语 之 间 的 对 
应 关系 。 





表 14. 1 遗传 学 术语 与 遗传 算法 术语 之 间 的 对 应 关系 
遗传 算法 
字符 帅 《 或 样本 ) 个 体 (individuD) 










遗传 学 
染色 体 (chrormosome》 

基因 (gene) 

代 (generatict 

繁殖 (reproduction) 再 生 









































14.1 遗传 算法 的 基本 特点 
遗传 算法 有 以 下 的 基本 特点 : 


人 传统 优化 算法 道 常 是 直接 处 理 函 数 和 它们 的 控制 变 盟 ， 而 址 传 算法 通过 编码 将 优化 
问题 的 自然 参数 编码 成 有 限 长 度数 字 串 位 , 故 址 传 算法 基本 上 不 受 函 数 约束 条 件 ( 如 连续 、 
可 导 、 单 调 等 ) 特性 的 限制 ， 能 在 极其 广泛 的 问题 求解 过 程 中 发 挥 作用 。 

名 传统 搜索 法 基本 .上 是 点 到 点 的 搜索 方法 。 在 多 极点 的 搜索 空间 里 常 陷 入 局 部 值 。 而 
遗传 算法 则 从 由 点 组 成 的 “群体 ”开始 搜索 ， 并 行 地 “让 ” 过 多 个 “山峰 ”， 使 陷入 局 域 
解 的 可 能 性 大 大 减 小 。 

名 另 外 在 遗传 算法 的 繁殖 进化 过 程 中 ， 这 种 点 间 的 信息 交换 可 明显 丽 速 遗传 算法 的 进 
化 过 程 。Heiland 证 明了 在 一 个 规模 为 产 个 的 种 群 中 ，O 〇 tm 模式 是 有 效 的 ， 即 每 一 代 遗 传 
算法 在 处 理 呈 个 串 的 模式 同时 ， 实 际 上 有 效 地 处 理 大 绝 岂 个 模式 。 这 是 一 个 非常 重要 的 
性 质 。Heolland 称 之 为 隐 并 行 性 。 

出 址 传 算法 在 选择 过 程 中 ， 依 据 一定 概 率 随 机 地 选择 个 体 是 为 了 模仿 自然 界 进化 过 程 
中 的 “ 适 者 生存 和 “优胜 劣 法 ”的 竞争 规则 ， 使 得 适应 环境 的 能 力 较 强 的 个 体 拥有 较 多 的 
母 生 机 会 ， 而 这 些 有 着 较 强 生命 力 的 解 群 在 引导 遗传 算法 的 搜索 方向 方面 可 能 包含 较 多 有 
价值 的 信息 。 人 允许 较 低 适应 度 的 个 体 以 较 低 的 概率 取得 再 生机 会 是 考虑 到 总 体质 量 较 差 的 
可 行 解 中 可 能 包含 某 些 优 秀 的 个 别 特性 。 所 以 遗传 算法 虽然 以 随机 化 方法 来 进行 搜索 ， 实 
际 上 是 朝 着 有 可 能 改进 解 的 质量 的 搜索 空间 进行 搜索 ， 即 为 一 种 有 导向 的 随机 化 搜索 方 
法 





大 多 数 传统 搜索 方法 都 需要 使 用 较 多 的 附 咱 特性， 如 可 徽 、 连 续 、 单 调 等 ， 而 遗传 算 
法 基本 上 不 用 搜索 空间 的 知识 和 其 他 附加 特性 ， 而 仅 用 适 配 度 函 数值 来 评估 个 体 ， 并 在 此 
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基础 上 进行 遗传 把 作 。 昌 于 喧 传 算法 的 适 配 度 函 数 不 受 连续 、 可 徽 、 单 调 等 性 质 的 约束 ， 
且 其 定义 域 可 以 任意 设 定 ， 因 此 ， 与 传统 搜索 算法 相 比 ， 遗 传 算法 具有 更 强 的 鲁 棒 性 ， 能 
适用 于 更 广泛 的 应 用 领域 。 

综 上 所 述 ， 遗 传 算法 是 一 类 针对 优化 问题 编码 空间 的 、 有 具有 导向 的 随机 化 优化 搜索 方 
法 。 其 自身 隐 食 着 并 进行 性 以 及 本 质 上 的 重 棒 性 ， 是 遗传 算法 区 别 于 传统 优化 搜索 方法 的 
主要 标志 。 


14.2 遗传 算法 的 基本 操作 


遗传 算法 是 一 种 对 群体 的 操作 ， 该 操作 以 群体 中 的 所 有 个 体 为 对 象 。 
1) 选择 (复制 ) 操作 
遗传 算法 的 选择 策略 是 对 达尔 文 进 化 论 中 “自然 选择 ”学 说 的 核心 思想 一 一 “ 适 者 生 
存 ， 优 胜 劣 琶 ”的 简单 模拟 ， 即 选择 日 标 主 要 包含 商 个 方面 的 内 容 : :是 配种 选择 ， 二 是 
生存 选择 。 配 种 选择 的 目标 是 希望 通过 对 交 义 配偶 有 倾向 性 的 选择 ， 产 生 适 配 度 较 高 的 后 
代 : 生存 选择 〈 又 称 种 群 选 择 、 样 本 选择 ) 的 目标 是 想 道 过 对 种 群 的 筛选 ， 更 新 保存 较 优 
的 料 本 ， 从 而 为 进化 创造 较 好 环境 条 件 。 
选择 操作 的 目的 是 为 了 从 当前 群体 中 选 出 优良 的 个 体 ， 使 它们 有 机 会 作为 父 代 为 下 一 
代 繁 殖 子 孙 。 判 断 个 体 优 良 与 和 否 的 准则 就 是 各 自 的 适 配 度 。 个 体 的 通 配 度 越 高 ， 被 选中 的 
机 会 就 越 大 。 
实现 选择 操作 的 方式 很 ， 其 类 型 主要 有 以 下 几 种 ， 
(1) 直接 基于 适 配 度 的 比例 选择 机 制 
全 财 轮 (Rouiette wheel selectiom 选 拌 方式 ; 
名 期 望 值 模型 (Expeceted value model) 选 择 方式 ; 
全 随机 竞争 (Stochastic tournament) 选 择 方式 。 
(2) 间接 基于 适 配 度 的 非 线 性 选择 机 制 
全 线性 标定 (Secaling): FJ=az+b : 


全 圭 关 数 标定 : jz)= zz : 


全 指数 标定 ， frzj=ezz 。 


(3) 基于 代 淘 (Ceneratiom) 方 式 的 种 群 选 择机 制 
(41) 基于 小 生境 技术 的 种 群 选 择机 制 
全 基于 预选 择 (Preselectionm) 相 制 的 小 生境 技术 ; 
名 基于 种 群 (Crowding) 札 制 的 小 生境 技术 ; 
贸 基 于 共享 (Sharing) 机 制 的 小 生境 技术 。 
常用 的 选择 操作 是 采用 和 适 配 度 成 比例 的 概率 方法 来 进行 选择 。 有 具体 地 说 ， 就 是 首先 


计算 群体 中 所 有 个 体 适 配 度 的 总 和 立志 ， 再 计算 每 个 个 体 的 适 配 度 所 占 的 比例 方 / 工 广 ， 
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并 以 此 作为 相应 的 选择 概率 。 

2) 交叉 (交换 ) 操作 

在 自然 生物 界 ， 基 因 重 组 是 保持 生物 特性 遗传 的 基本 方法 ， 也 存 获 取 大 量 遗传 变异 的 
最 主要 来 源 。 遗 传 算法 中 的 交 义 操作 可 视 为 对 生物 遗传 过 程 中 基因 生 组 的 直接 模拟 ， 其 任 
公 是 将 两 个 配对 全体 相 结 合 ， 通 过 基因 及 部 分 结构 的 随机 交换 和 重新 组 合 方式 生成 新 的 个 
体 。 一 般 说 ， 交 叉 算 子 若 缺 少 “ 遗 传 ” 性 ， 父 代 的 优良 品质 就 难以 被 继承， 进化 过 程 的 
历史 信息 将 不 能 被 有 效 地 利用 ， 有 利 的 遗传 变异 也 得 不 到 逐渐 积累 并 在 种 群 中 稳定 下 来 ， 
遗传 算法 的 局 域 搜索 能 力 和 收 敏 性 均 将 受到 不 利 影响 。 

纪 外 ， 过 强 的 “ 变 蜡 ”能 力 还 有 可 能 使 遗传 算法 的 随机 搜索 无 法 收 和 化 。 另 -~ 方面 ， 交 
又 操作 若 缺 少 “ 变 尼 ” 性 ， 遗 传 变异 库 就 难以 被 更 新 和 丰富 ， 这 将 使 进化 过 程 缺乏 动力 ， 
使 遗传 算法 跳出 局 域 陷 孟 的 能 力 大 为 降低 ， 还 可 能 使 初始 化 产生 让 寅 的 遗传 变异 迅速 趋向 
单调 ， 和 遗传 算法 趋同 不 成 熟 收效 。 

所 以 在 设计 交叉 算 子 时 ， 需 要 鳃 顾 如 下 两 个 基本 要 求 : 

交叉 操作 要 有 利于 父 串 关键 特征 〈 横 式 ) 以 及 有 利 士 变异 的 遗传 和 继承 ; 

包 交 叉 操 作 要 有 利于 遗传 变 措 库 的 更 新 和 直 寅 。 

简单 的 交叉 可 分 两 步 进行 ， 首先 对 种 群 中 的 个 体 某 一 个 概率 值 进 行 随机 配对 ， 其 次 在 
配对 个 体 中 随机 设 定 交叉 处 ， 被 配对 个 体 彼 此 交换 部 分 信息 。 交 叉 操 作 类 型 一 般 有 -- 点 交 
尺 (fone-point crossovem、 二 点 变 叉 (two-point crossovem、 多 点 交叉 (multi-poiat crossover 和 和 
一 致 变 叉 (uniform crossovem 几 种 。 

遗传 算法 的 变 叉 过 程 可 以 看 作 是 等 位 基因 的 竞争 过 程 ， 对 于 两 个 父 串 的 同型 等 位 基 
因 ， 因 为 无 竞争 可 育 ， 子 串 直 接 继 姑 这 些 同 类 型 等 位 基因 是 很 自然 的 ， 吊 对 于 两 个 父 由 的 
打 型 等 位 基因 《一 个 是 D， 另 一 个 是 1)， 在 难以 分 辨 熟 优 讨 劣 的 情形 下 ， 采 取 纯 随机 方式 
进行 选择 就 不 失 为 一 种 可 行 的 方法 。 随 机 性 归纳 法 式 交 义 操 作 方 法 就 是 基于 这 种 考虑 设计 
的 ， 它 直接 继承 两 个 父 趾 的 同型 等 位 基因 ， 而 对 杂 型 等 位 基因 则 按 纯 随机 方式 产生 。 显 然 
这 一 变 及 方法 使 子 代 继 芋 了 双亲 的 同型 等 位 基因 ; 对 于 双亲 的 杂 型 等 位 基因 ,“ 与 /或 ” 交 
立方 法 采取 了 两 种 不 同 的 “强调 ”策略 :“ 与 ”运算 强调 0 基因 作用 ， 而 “或 ”运算 则 强 
调 1 基因 作用 。 有 趣 的 是 ， 这 种 交叉 方法 与 生物 遗传 学 的 显 性 现象 相关 似 , “与 ”运算 将 
L 视 为 耻 性 基因 ， 而 “或 ”运算 将 0 视 为 幅 人 性 基因 。 这 种 有 效 交 叉 操 作 的 增多 ， 有 利于 维 
护 种 群 的 多 样 性 ， 加 速 遗 忧 算法 的 进化 过 程 ， 提 高 遗传 算法 的 优化 效率 。 

3 变异 操作 

在 遗传 算法 中 ， 变 异 操 作 的 主要 作用 是 防止 重要 基因 的 丢失 ， 维 护 种 群 的 基因 型 多 样 
性 。 在 生物 进化 过 程 中 ， 变 全 概率 是 相当 小 的 ， 约 在 104 数 量 级 。 在 遗传 算法 中 ， 无 论 从 
确保 遗传 算法 的 收 化 性 ， 还 是 从 提高 遗传 算法 的 优化 效率 方面 考虑 ， 变 异 概率 均 不 宜 取得 
过 大 ， 和 否则 遗传 算法 将 出 现 随 机 搜索 。 

在 较 小 变异 概率 下 ， 变 蜡 操 作 仅 使 种 群 基因 组 成 的 基因 型 结 攀 发 生 拆 量 的 变化 〈 能 引 
起 种 群 基因 组 成 的 基因 型 结构 发 生 重 大 变化 的 变异 操作 ， 人 往往 不 太 可 能 是 有 利 的 )。 但 选 
择 操 作 的 方向 性 和 交叉 操作 的 遗传 性 , 将 使 微小 的 、 点 点 滴 滴 的 有 利 变异 能 得 到 逐渐 积累 ， 
并 在 种 群 中 逐步 扩散 和 称 定 下 米 。 所 以 ， 变 异 操 作 是 十 分 微 扫 的 遗传 操作 ， 它 需要 和 交叉 
操作 妥善 配合 使 用 , 日 的 是 挖掘 群体 中 个 体 的 多 样 性 , 克服 有 可 能 限于 局 部 最 优 解 的 站 病 。- 
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变异 算 子 的 具体 做 法 是 把 茶 一 个 体 中 的 每 一 位 按 某 一 个 概率 进行 取 反 运算 ， 即 由 1 变 
为 0 和 由 0 变 为 1。 同 自然 界 一样 ， 每 一 位 发 生变 孚 的 概率 是 很 小 的 ， 遗 传 算法 的 搜索 能 
力主 要 是 由 选择 和 交 义 操作 完成 ， 而 变异 操作 则 保证 算法 能 搜索 到 问题 解 空间 的 每 一 点 ， 
使 算法 具有 全 局 收 敏 性 。 

遗传 算法 依据 每 个 个 体 的 适 配 度 利用 选择 、 交 叉 、 变 异 算 子 对 个 体 进 行 更 新 换代 。 选 
择 算 子 模拟 了 生物 中 的 自然 选 择 现象 。 适 配 度 越 大 ， 被 选中 的 可 能 性 越 大 ， 其 子孙 在 下 一 
代 中 的 个 数 越 多 。 有 具体 的 实现 方法 有 竞赛 选择 、 转 轮 式 选择 ， 以 及 无 替代 剩余 随机 采样 选 
择 等 。 交 叉 算 子 则 以 一 定 的 概率 变换 从 某 一 位 置 起 两 个 个 体 的 部 分 基因 ， 它 模拟 了 群体 繁 
昔 过 程 中 的 交配 现象 。 通 过 交 义 算 子 就 有 可 能 将 个 体 中 的 优良 基因 组 合 在 一 起 ， 使 个 体 表 
现 出 良好 的 性 能 。 变 异 算 子 横 拟 了 遗传 机 理 中 的 变异 现象 ， 它 以 较 小 概 率 改变 染色 体 中 的 
基因 。 在 二 进 制 编码 中 ， 变 异 算 子 以 一 定 的 概率 将 某 一 位 置 的 1 变 成 0， 或 者 将 0 变 成 1。 
变 红 本 号 是 一 种 随机 搜索 ， 然 而 与 选择 、 交 又 算 子 结合 在 一 起 ， 就 能 避免 由 于 选择 与 交叉 
算 子 而 引起 的 某 些 信息 的 永久 性 竺 失 ， 从 而 保证 了 遗传 算法 的 有 效 性 。 


14.3 遗传 算法 的 设计 步骤 


遗传 算法 以 随机 产生 的 一 群 候选 解 为 开始 ， 而 每 一 解 均 被 表示 成 字符 申 有 形式。 通过 使 
用 遗传 算 了 于 对 这 些 字 符 串 进行 组 合 ， 这 些 候选 解 逐 步 朝 着 更 好 解 的 方向 进化 。 这 些 遗 传 操 
作 《 瑾 选择、 交叉 和 变异 ) 则 分 划 横 拟 自然 选择 和 自然 遗传 过 程 中 发 生 的 基因 繁殖 、 交 配 
和 突变 现象 。 在 每 一 代 对 于 给 定 问 题 ， 我 们 维持 了 一 个 数 日 w 恒定 的 群体 ， 通 过 计算 各 
解 的 适 配 值 .AP 使 这 些 解 得 到 评价 。 根 据 各 解 的 是 适 配 值 的 大 小 ， 分 配 繁殖 机 会 ， 适 配 值 
相对 高 的 个 体 在 下 一 代 得 到 更 多 的 繁殖 机 会 ， 产 生 更 多 的 后 代 ， 而 适 配 舍 低 的 个 体 则 产生 
的 后 代数 目 少 ， 甚 至 被 性 能 更 好 的 后 代 个 体 所 代替 。 被 选 个 体 又 利用 交叉 、 变 异 等 遗传 算 
子 进 行 组 合 ， 形 成 新 的 一 代 。 

在 应 用 遗传 算法 求解 具体 问题 时 ， 主 要 考虑 以 下 几 个 问题 : 

1) 参数 编码 

由 于 遗传 算法 不 能 直接 处 理 空 间 的 数据 ， 所 以 必须 通过 有 效 且 通用 的 编码 方法 ， 将 问 
题 的 可 能 解 编 码 表示 成 有 限 位 的 字符 串 ， 成 为 遗传 空间 的 基因 型 四 结构 数据 。 

对 寻 优 参数 编码 。 确 定 寻 优 参数 和 各 参数 的 变化 范围 ， 将 各 寻 优 参数 用 无 符号 的 二 进 
制 数 表 示 。 设 某 寻 优 参 数 a 的 变化 范围 基 Jauoensd]， 若 用 m 位 二 进 制 数 二 来 表示 ， 则 五 
可 由 下 式 求 得 : 

瑟 =(27-DG-amninyienar -amniny) {14.1) 

再 将 所 有 寻 优 参数 的 一 进 制 数 串 联 成 一 个 二 进 制 的 字符 绅 s， 又 称 为 样本 。 若 有 个 
可 优 参 数 ， 每 个 参数 都 用 六 位 二 进 制 数 表示 ， 则 字符 串 s 共有 症 xr 位 。 

另外 ， 还 采用 实数 等 方法 进行 编码 。 

2 ) 种 群 初始 化 

确定 遗 忧 算法 所 使 用 的 各 参数 的 取 值 ， 如 群体 规模 上 ， 交 叉 、 变 鼻 等 发 生 的 概率 。 
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车 无 先 验 知识 ， 可 参 机 产生 闫 个 字符 串 〈 样 本 ?， 组 成 一 个 种 群 (Population)。 

3) 求 各 样本 的 进 配 值 

根据 纺 码 方法 以 及 问题 的 要 求 ， 设 计 一 个 适 配 度 函 数 户 用 以 测量 和 评价 各 解 的 性 能 。 
这 个 适 配 度 函 数 实际 上 对 应 于 最 优化 的 指标 函数 。 用 每 个 样本 对 应 的 一 组 寻 优 参数 计算 其 
适 配 值 (Fitness Value)， 并 按 从 优 到 劣 的 次 序 排 列 。 

4) 选择 【Seletion) 


求 出 各 样本 的 适 配 度 ， 

玉 = 户 1/ 荆 方 ，i= 工 2 有 (14.2) 

对 种 群 中 各 样本 以 优 于 疡 值 的 原则 选择 出 案 作 为 父母 样本 ， 并 随机 地 两 两 配对 ， 用 
交叉 和 变异 的 方 活 繁 殖 后 代 。 


5) 间 丸 【Crossover) 

在 父母 样本 A、B 的 字符 串 中 随机 地 产生 一 个 分 段 点 ， 将 分 段 点 之 后 的 子 串 互 换 ， 生 
成 两 个 子女 样本 ， 如 下 列 ; 

A=1IOLMOI1 A 二 11017110 
B = 0010/110 B 一 0010/011 

交换 概率 可 定 为 0.6 一 410。 

1) 变异 (mutatiorm) 

在 每 个 子女 样本 的 字符 串 中 随机 地 选择 一 位 ， 将 其 数值 求 反 ( 即 1 变 为 0, 0 变 为 1)。 
变 措 概率 为 0.001 一 0.01。 

7) 薪 环 

将 新 产生 的 子女 样本 加 入 原料 本 中 ， 或 可 以 直接 加 入 前 面 被 选 出 的 优秀 的 父 斐 样 本 
中 ， 组 成 新 种 群 。 到 此 ， 一 轮 遗 传 探 作 完成 。 新 种 群 返 句 到 3)， 再 用 每 个 样本 对 应 的 一 
组 寻 优 参数 计算 其 适 配 值 ， 并 按 从 优 到 淄 的 次 序 排列 ， 并 进行 下 一 次 选 代 计算 ， 直 至 达到 
满意 的 性 能 指标 〈 或 适 配 值 )。 在 最 后 的 种 群 中 选择 最 好 的 一 个 样本 ， 将 其 字符 串 解 三 后 
即 得 到 最 优 的 参数 值 。 

由 以 上 本 以 看 出 ， 遗 传 算法 是 模仿 “优胜 劣 瀛 、 适 者 生存 ”的 生物 进化 过 程 ， 寻 优 参 
数 的 字符 串 编 码 类 似 于 生物 染色 体 中 遗传 基因 的 排列 ， 对 字符 串 的 变 叉 和 变异 对 应 生物 繁 
殖 过 程 中 得 传 基 因 的 重新 组 合 和 究 变 ， 而 客观 存在 的 生物 进化 法 则 保证 了 遗传 算法 的 有 效 
性 和 通用 性 。 为 了 加 人 快 收 往 速 度 而 又 保证 得 到 全 集 最 优 解 ， 对 址 传 算法 亦 有 不 少 研 究 和 改 
进 。 





14.4 遗传 工法 的 实质 


传统 的 遗传 算法 即 可 使 用 选择 、 交 换 和 变异 三 种 遗传 操作 ， 这 二 种 非常 简单 的 操作 如 
何 使 遗传 算法 拥有 如 此 强大 的 优化 能 力 。Holland 在 他 所 建立 的 模式 理论 中 (Sehemata 
Theory) 首 次 从 理论 的 角度 回答 了 这 个 问题 。 

从 和 模式 的 角度 看 ， 遗 传 算法 的 搜索 过 程 其 本 质 是 对 隐 含 在 可 行 解 钢 码 串 肉 的 “模式 ” 
的 抽样 过 程 。 关 于 遗传 算法 的 收 仇 性 ， 标 准 遗 忧 算法 在 变异 概率 为 0 时， 必然 收 化 于 一 个 
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下， 


吸收 状态 ， 但 不 能 确保 收 敏 于 全 局 最 优 解 :标准 遗传 算法 在 变异 概率 不 为 零 时 ， 是 不 收 煞 
的 。 但 遗传 算法 的 一 些 变形 形式 ， 例 如 附加 “记录 口 知 最 佳 解 ” 策 略 的 过 传 算法 ， 采 用 最 
佳 保留 选择 策略 的 遗传 算法 以 及 选用 已 知 最 佳 个 体 构 成 种 群 的 基本 遗传 算法 均 能 在 时 间 无 
限时 以 概率 1 收敛 于 全 局 最 优 解 。 

尽管 已 经 证 明了 一 些 基本 竹 传 算法 最 终 能 收 敏 到 全 局 最 优 解 ， 但 所 需 时 间 可 能 是 无 限 
的 。 从 实用 角度 看 ， 在 无 限时 间 内 收 误 到 全 局 最 优 解 是 没有 实用 价值 的 。 所 以 一 般 地 说 ，， 
优化 方法 只 能 从 较 高 的 搜索 效率 和 较 好 的 优化 效果 之 间 进 行 权 衡 ， 以 期 获得 综合 收益 。 从 
这 种 意义 上 讲 ,， 提高 在 有 限时 间 内 搜索 到 全 局 最 优 解 的 概率 ,以 及 确定 算法 的 时 间 复 杂 性 ， 
显然 是 更 为 重要 的 、 具 有 实际 价值 的 问题 。 

在 遗传 算法 的 时 间 复 杂 性 上 ， 首 先 ， 变 异 换 作 的 存在 增加 了 迁 传 算法 的 时 间 复 杂 人 性 ， 
其 次 ， 标 准 过 传 算 法 的 时 间 复 杂 性 在 变异 概率 较 小 的 情况 下 主要 与 遗传 算法 的 种 群 规模 、 
染色 体 编 码 长 度 以 及 优化 对 象 本 身 的 可 行 解 分 布 的 特性 密切 相关 。 一 般 来 说 ， 遗 传 算法 种 
群 规 模 越 大 ， 娄 色 体 风 码 长 度 越 长 ， 则 遗传 算法 时 间 复 杂 性 越 高 。 

遗传 算法 的 进化 机 制 包含 者 遗传 变异 (由 交叉 和 变异 操作 提供 ) 的 产生 和 选择 策略 (有 
选择 操作 实现 ) 两 方面 的 综合 作用 ， 其 选择 操作 是 在 适 配 度 空间 内 进行 的 ， 而 交叉 、 变 蜡 
操作 则 是 在 基因 型 空间 内 进行 ， 遗 传 算法 的 优化 思想 原本 是 期 望 通过 有 倾向 性 的 选择 ， 并 
借助 变 叉 、 变 异 操作 的 基因 型 重 枸 能 力 ， 增 如 进入 全 局 最 优 解 所 在 区 域 的 机 会 并 搜索 到 全 
局 的 最 优 解 。 但 由 于 遗传 算法 在 适 配 度 空间 内 的 选择 操作 与 在 基因 型 空间 的 交叉 、 变 蜡 操 
作 存 在 着 明显 的 矛盾 ， 使 得 这 种 优化 思想 尚 不 完善 。 总 之 ， 从 全 局 最 优化 角度 考虑 ， 由 于 
目前 还 难以 准确 评估 进化 意义 上 的 个 体 适 配 度 ， 这 就 使 得 基于 个 体 适 配 度 的 交配 选择 存在 
相当 的 盲目 性 。 


144.5 小 ” 结 


忆 和 遗传 算法 主要 是 靠 种 群 基 因 型 的 多 样 性 提供 进化 机 会 的 ， 要 使 遗传 算法 产生 不 断 进 


化 的 效果 ， 就 必须 在 整个 优化 过 程 中 维持 种 群 基因 型 的 多 冬 性 。 


加 依据 模式 理论 ， 壮 传 算法 的 搜索 是 对 隐 含 在 编码 串 内 的 模式 抽样 和 编码 串 问 的 模式 
重 构 的 过 程 。 

时 从 机 理 . 上 讲 ， 遗 传 算法 是 依据 种 群 内 个 体 间 的 基因 值 和 基因 型 的 相似 性 来 确定 遗传 
算法 的 搜索 方向 的 。 
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第 15 章 遗传 算法 的 应 用 
15.1 采用 遗传 算法 提高 神经 网 络 模型 辨识 的 精度 


15.1.1 引言 


被 控 对 象 的 模型 辨识 和 系统 的 建 模 在 控制 系统 的 设计 过 程 中 占有 重要 的 地 位 。 即 使 是 
采用 诸如 模糊 逻辑 控制 等 这 类 不 依赖 于 被 控 对 象 精确 数学 模型 的 控制 策略 ， 在 设计 、 分 析 
和 系统 仿真 过 程 中 ， 准 确 的 系统 输入 /输出 特性 的 获得 ， 无 疑 使 所 设计 的 参数 更 加 接近 实 
奈 控 制 系统 ， 在 一 定 程度 上 ， 能 够 加 快 设计 进程 ， 提 高 设计 质量 ， 所 以 准确 快速 地 获得 复 
杂 的 被 控 对 象 输入 /输出 特性 ， 在 对 控制 的 快速 和 高 精度 要 求 的 今天 ， 具 有 相当 重要 的 意 
义 。 

离线 批 处 理 的 系统 参数 辨识 过 程 ， 只 能 辨识 出 线性 系统 或 非 线 性 系统 在 线性 段 上 工作 
点 的 模型 ， 从 而 限制 了 对 非 线性 系统 的 应 用 ， 人 工 神经 网 络 以 其 特有 的 自 组 织 、 自 学 习 的 
能 态 ， 能 够 对 无 法 通过 物理 公式 推导 出 的 复杂 的 或 非 线性 系统 的 模型 ， 进 行 输入 /输出 关 
系 的 特性 训练 ， 这 一 特性 为 非 线性 系统 建 模 开 辟 了 一 条 新 的 途径 。 不过， 人 工 神 经 网 络 也 
存在 着 不 足 之 处 。 首 先 ， 网 络 的 结构 设计 没有 统一 的 标准 ， 其 次 ， 网 络 的 学 习 训练 是 一 个 
艰难 的 过 程 ， 离 线 训 练 往往 需要 很 长 时 间 ， 能 和 否 获得 最 优 解 ， 在 很 大 程度 上 取决 于 初始 值 
的 随机 性 。 为 了 获得 最 优化 ， 常 常 需 要 重复 多 次 训练 。 最 大 的 不 中 是 易于 陷入 局 部 极 小 值 ， 
而 达 不 到 学 习 的 目的 。 

上 述 敏 点 基因 为 人 工 神经 网 络 所 采用 的 反 加 传播 (BB) 法 本 质 上 是 梯度 下 降 法 ， 而 BP 
网 络 的 学 习 过 程 又 是 对 一 个 高 度 非 线性 目标 函数 求全 局 最 优 和 解 的 过 程 ， 所 采用 的 又 是 传统 
的 一 维 搜索 法 。 昌 然 人 们 已 采用 了 各 种 改进 措施 试图 解决 上 述 问题 ， 但 这 些 措施 也 只 能 在 
某 些 特殊 情况 下 有 效 ， 未 能 从 根本 上 解决 问题 。 

与 人 工 神经 网 络 依赖 于 起 始点 单 点 优化 搜索 不 同 ， 址 传 算法 (GA) 保 持 了 一 个 潜在 解 
的 群体 ， 实 现 了 多 个 方向 上 的 搜索 。 同 时 ， 在 搜索 过 程 中 鼓励 不 同方 向 上 信息 的 结合 和 交 
流 ， 使 群体 经 历 了 一 个 模拟 进化 过 程 : 每 一 代 中 ， 较 好 的 解 “ 再 生 ”， 较 差 的 解 “ 消 亡 ”。 
从 而 大 大 减少 了 陷入 局 部 解 的 可 能 性 。 遗 传 算法 为 解决 人 工 神 经 网 络 所 存在 的 问题 ， 继 而 
提高 人 工 神经 网 络 对 系统 特性 辨识 的 精度 和 速度 ， 提 供 了 可 能 性 。 但 对 GA 进行 应 用 研究 
时 ， 如 何 对 所 要 解决 的 问题 应 用 GA， 以 及 应 用 GA 的 成 效 ， 在 一 定 程度 上 取决 于 设计 者 
对 遗传 算法 和 所 要 解决 问题 的 理解 程度 。 在 上 一 章 里 已 经 对 站 传 算法 的 理论 和 设计 作 了 大 
体 介绍 ， 本 节 将 采用 遗传 算法 进行 具体 的 优化 建 模 网 络 的 应 用 。 为 了 能 够 加 快 收敛 速度 ， 
对 标准 遗传 算法 进行 适当 的 改进 。 
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15. 1.2 改进 的 遗传 算法 


思 编码 

应 用 标准 的 遗传 算法 进行 变量 的 编码 和 解码 ， 当 变量 众多 、 取 值 范围 大 或 无 法 给 定 范 
围 时 ， 此 种 方法 将 使 GA 的 收敛 速度 降低 ， 同 时 在 变量 的 编码 与 解码 过 程 中 ， 常 会 导致 有 
用 信息 的 丧失 ， 而 且 存 在 精度 和 算法 量 之 间 的 矛盾 。 所 以 我 们 对 其 进行 改进 : 采用 直观 的 
实数 编码 ， 以 每 一 权重 值 的 每 一 自然 数字 作为 基因 ， 所 有 权重 值 的 顺序 排列 组 成 一 个 染色 
体 。 这 样 既 方便 了 后 面 所 要 进行 的 遗传 操作 ， 又 共有 直观 性 和 实用 的 方便 性 。 

2) 这 传 操 作 

遗传 操作 主要 包 插 复制 、 交 换 和 罕 变 ， 其 目的 是 将 当代 群体 变 为 下 一 代 群 体 。 其 过 程 
是 : 首先 按 正 比 于 适 配 值 的 概率 选择 本 代 中 的 个 体 进 行 复制 。 通 过 复制 ， 淘 沐 最 差 个 体 ， 
但 未 创造 出 新 的 个 体 。 交 配 操作 能 够 造 出 新 的 个 体 。 参 加 交配 的 两 个 个 体 也 是 基于 适 配 值 
按 比 例 选 择 的 ， 交 配 结果 产 出 两 个 新 的 个 体 。 但 当 所 有 个 体 串 全 都 一 样 时 ， 交 换 操 作 虽 不 
能 产生 新 的 个 体 ， 这 时 由 交配 操作 产生 的 后 代 的 适 配 值 不 再 比 它们 的 前 辈 更 好 而 又 未 达到 
全 局 最 优 解 ， 这 就 发 生 了 所 谓 的 早熟 收敛 。 早 灼 收 仇 的 根源 是 发 生 了 有 效 基 因 的 缺失 ， 为 
克服 这 种 情况 ， 只 有 依赖 于 帘 变 。 但 常规 的 罕 变 效果 是 不 明显 又 很 慢 的 。 

在 遗传 操作 过 程 中 ， 适 配 值 一 直 起 着 衡量 操作 结果 优 劣 的 作用 。 对 于 上 所 要 解决 问 题 的 
不 同 ， 适 配 值 表 达 式 的 内 容 也 是 不 同 的 。 在 系统 输入 /输出 特性 辨识 的 问题 中 ， 适 应 值 一 
般 末 用 样本 输出 与 神经 网 络 和 输出 信号 之 间 差 的 平方 和 ， 其 目标 是 求 得 适 配 值 最 小 时 的 一 组 
神经 网 络 的 权重 值 。 

为 了 保持 解 的 多 样 性 ， 并 防止 早熟 现象 , 在 辨识 过 程 中 ,对 遗传 操 作 进 行 了 如 下 改进 : 

在 复制 过 程 中 ， 在 AN 个 个 体 中 糙 小 于 平均 适 配 值 的 个 体 复 制 下 来 ， 淘 汰 高 于 平均 适 配 
值 的 劣 值 个 体 个 ,被 淘汰 的 王 个 个 体 的 空缺 ,采用 随机 取 数 方式 进行 增补 , 当 半 小 于 (L4)N 
时 ， 随 机 增补 的 个 体 数 取 为 (L4)w。 保 持 (L4)xw 的 随机 个 体 数 ， 是 为 了 保持 群体 交换 过 程 
中 的 多 样 性 。 

为 了 确保 搜索 的 全 局 最 优 ， 将 本 代 中 的 最 优 解 直 接 进 化 到 下 一 代 中 。 代 表 权 重 值 的 实 
数 取 为 一 位 整数 和 四 位 小 数 的 数字 ， 以 保持 足够 的 精确 度 。 在 交换 操作 中 ， 将 上 一 代 最 优 
值 放 入 第 一 个 个 体 ， 将 2 到 NM2 之 间 的 合体 的 后 三 位 少数 与 六 - 1 到 (2) + 1 之 闻 的 个 体 
数值 中 的 后 三 位 小 妆 进 行 相 互 变 换 ， 形 成 新 的 (WA2) - 工 个 个 体 ， 同 时 ， 对 于 (WwW2) + 工 到 六 
的 个 体 的 选取 ， 用 其 后 三 位 小 数 与 1 到 W2 的 个 体 后 三 位 小 数 之 间 进 行 交 换 来 获得 。 在 交 
换 后 所 获得 新 的 六 个 个 体 中 ， 从 (4) + 1 到 34 个 个 体 是 经 过 次 优 个 体 之 疝 的 交换 得 到 
的 ， 而 前 WA4 和 后 NWf4 的 个 体 ， 因 为 与 其 交换 的 个 体 中 均 有 W4 个 个 体 为 随机 数 ， 所 以 它 
们 与 次 优 个 体 交 换 后 ， 可 以 产生 新 的 个 体 ， 尤 其 在 经 过 数 代 进化 后 ， 这 些 不 断 变化 的 新 个 
体 有 效 地 延缓 了 早熟 的 出 现 。 在 交换 位 数 的 选择 上 ， 实 验证 明 后 三 位 小 数 的 同时 交换 的 效 
果 最 好 ， 优 化 效率 最 高 。 取 一 位 或 二 位 时 的 进化 收敛 速度 都 较 慢 。 

由 于 搜索 空间 的 性 质 和 随机 值 的 优 劣 ， 在 进化 过 程 中 ， 仅 靠 交 换 往往 会 出 现 早 期 陷入 
局 部 解 而 中 止 进 化 。 配 合 有 效 的 变异 操作 可 防止 其 出 现 。 在 所 应 用 的 实数 编码 中 ， 采 用 的 
变异 法 是 将 基 个 个 体 中 的 某 一 自然 数 变 为 另 一 自然 数 ， 而 不 是 按 标准 GA 中 改变 某 一 位 置 
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上 的 数字 。 其 目的 是 为 了 增加 随机 性 ， 进 而 增加 多 样 性 。 随 着 进化 代数 的 递增 ， 进 行 突变 
次 数 的 比例 数 也 随 之 增加 ， 以 便 硅 接 近 最 优 解 的 群体 中 能 够 增加 更 多 的 新 的 个 体 。 突 变 比 
例 次 数 在 整个 搜索 过 程 中 是 由 0.05 变化 到 0.12。 


15. 1.3 实例 验证 


为 了 验证 所 提出 的 改进 过 和 传 算法 的 有 效 性 ， 将 其 用 于 对 具有 严重 非 线性 摩擦 万 影响 的 
直流 电机 速度 的 输入 /输出 特性 的 辨识 中 。 为 了 获得 有 效 的 动态 性 能 的 辨识 ， 人 工 神经 网 
络 的 结构 采用 双 输 入 、 单 输出 ， 双 输入 分 别 为 态 矩 以 及 输出 的 一 阶 延 迟 信号 、 网 络 节 点 结 
构 取 为 (2 -5- 1)， 隐 售 层 中 采用 $ 型 函数 ， 和 输出 层 为 线性 函数 。 网 络 的 结构 如 图 15.1 所 
示 。 选 取 群 体 数 w = 50， 在 最 大 进化 代数 200 完成 以 后 ， 误 差 平方 和 达到 0.0042， 其 辨识 
后 的 验证 效果 如 图 15.2 所 示 ， 其 中 实 线 为 对 象 的 输出 ， 虚 线 为 网 络 模型 的 输出 。 





加 
时 间 (种 ) 


图 15.2 辨识 后 的 网 络 输出 与 实际 对 象 输出 
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作为 对 比 ， 对 同一 对 条 采 用 带 有 自 适 应 学 习 速 率 的 反 辐 传播 (BP) 法 进行 辨识 。 在 经 过 
2000 次 循环 训练 后 ， 所 达 误 差 平方 和 为 0.0088。 两 种 方法 的 结果 如 表 15.1 所 示 。 从 中 可 
以 看 出 ， 采 用 改进 的 遗传 算法 对 加 速 收 全 速度 、 提 高 辨识 精度 有 洲 明 显 的 效果 。 





表 15. 1 两 种 寻 优 方 法 的 对 此 结果 


训练 次 数 “| 达 到 最 小 误差 和 
自 适应 BP 





15. 1.4 小 结 





改进 的 遗传 算法 可 以 有 效 地 加 速 优化 疏 敏 速度 ， 提 高 对 系统 辨识 的 精度 ， 尤 其 在 对 复 
休 系 统 进 行 模型 辨识 时 ， 更 能 体现 出 它 的 优越 性 。 


15.2 模糊 神经 网 络 和 遗传 算法 相 结合 的 控制 策略 


15. 2.1 引言 


近年 来 , 模糊 逐 辑 控制 、 神 经 网 络 等 技术 得 到 了 迅速 发 展 ， 并 引起 了 人 们 的 广泛 关注 。 
昌 于 模糊 逐 辑 控制 具有 较 强 的 鲁 棒 性 和 灵活 性 ， 因 前 其 在 一 些 非 线 人 性、 动态 特性 变化 大 和 
无 法 进行 数学 建 模 的 系统 中 灵 示 出 明显 的 优越 性 。 然 而 由 于 模糊 逻辑 控制 从 本 质 上 来 说 是 
基于 人 的 经 验 ， 故 在 选取 合适 的 对 控制 效果 起 决定 性 作用 的 隶属 函数 和 控制 规则 时 ， 先 验 
知识 就 显得 尤为 重要 。 但 是 这 种 先 验 知识 一 般 米 说 往往 是 比较 缺乏 或 不 全 面 的 ， 特 别 对 某 
些 复杂 的 和 非 线 件 系统 来 说 ， 根 本 就 不 可 能 得 到 详细 或 准确 的 先 验 知识 ， 这 就 为 模糊 逐 辑 
控制 的 有 效 实施 和 粳 度 的 提高 带 来 了 一 定 的 困难 。 

为 了 解决 这 一 轨 难 ， 人 们 一 方面 不 得 不 采用 较 多 的 模糊 子 集 以 及 更 多 的 控制 规则 ， 另 
一 方面 也 在 不 断 地 研究 可 以 自动 生成 、 修 改 以 及 优化 隶属 函数 和 控制 规则 的 方法 与 技术 。 
然而 在 目前 尚 无 成 熟 调 试 方法 的 情况 下 ， 仅 赁 经 验 要 起 对 众多 的 待 调 参数 得 到 一 合适 的 组 
合 是 相当 困难 的 ， 另 外 ， 正 是 因为 存在 诸多 的 待 调 参数 ， 使 得 人 们 往往 只 能 针对 模糊 逻辑 
控制 的 某 一 方面 进行 优化 ， 例 如 仅 对 比例 因子 进行 在 线 修改 以 改善 系统 性 能 ， 或 仅 对 隶属 
函数 的 形状 和 位 置 进行 优化 ， 或 只 嘴 履 整 模糊 控制 规则 等 等 。 但 是 ， 异 糊 逻 辑 控 制 的 总 体 
效果 是 所 有 模糊 化 、 模 戎 推理 和 解 模糊 等 诸多 方面 的 有 机 综合 ， 只 有 对 各 部 分 同时 进行 的 
优化 示 可 李 达 到 最 优 的 控制 效果 。 另 外 ， 这 些 研 究 对 如 何 将 模糊 子 集 和 模糊 规则 的 个 数 减 
少 到 最 少 ， 同 时 又 不 降低 模糊 逻辑 控制 的 效果 涉及 较 少 。 模 糊 子 集 和 模糊 规则 数 的 多 寡 是 
体现 模糊 逻辑 的 复杂 程度 的 重要 标志 以 及 影响 异 糊 控制 物理 实现 的 重要 因素 。 


本 节 给 出 了 一 种 将 异 糊 丈 辑 控制 、 神 经 网 络 和 遗传 算法 有 机 结合 而 进行 全 局 优化 的 控 
218 








aa delphi 桂 iir va iu timer 


制 策 略 ， 为 解决 所 存在 的 困难 提供 了 可 能 的 途径 。 首 先 ， 采 用 人 工 神 经 网 络 实现 模糊 辑 
控制 的 全 过 程 ， 从 而 使 神经 网 络 的 结构 具有 模 灶 逻辑 控制 的 功能 ， 同 时 每 一 个 参数 均 具 有 
明确 的 模糊 还 辑 意义 ; 其 次 ， 利 用 人 工 神经 网 络 对 信息 处 理 具有 自学 习 和 自 适应 的 特性 对 
其 参数 和 结构 同时 进行 优化 处 理 ， 而 达到 在 最 简 结构 下 获得 最 优 控制 效果 的 目的 。 为 了 加 
快 学 习 速 度 以 及 避免 陷入 局 部 极 小 值 ， 文 中 引进 了 遗 传 算法 。 所 提 控 制 策略 的 实质 是 将 多 
种 方法 和 技术 进行 有 机 的 综合 ， 使 它们 之 间 取 长 补 得， 在 最 简 的 结构 下 优化 全 部 参数 ， 达 
到 最 佳 控制 效果 。 本 章节 在 给 出 优化 控制 系统 结构 后 ， 对 优化 后 的 仿真 结果 进行 了 对 比分 
析 ， 并 且 给 出 了 优化 后 的 隶属 函数 图 以 及 控制 器 的 输入 /输出 特性 曲面 图 。 


15. 2. 2 优化 控制 系统 的 结构 


优化 控制 系统 的 结构 如 图 15.3 所 示 ， 其 中 P 为 被 控 对 象 ，NNP 为 采用 被 控 对 象 的 输 
入 /输出 信号 ， 通 过 训练 而 辨识 下 的 P 的 神经 网 络 模型 ，GNEFC 为 基于 遗传 算法 优化 的 有 具 
有 明确 模 类 尿 辑 意义 和 模糊 推理 功能 的 神经 网 络 控制 器 。 控 制 器 的 训练 是 通过 使 GNPFC 
与 NNP 相 串 联 ， 连 接 成 负 反 饮 控 制 回 路 ， 并 采用 遗 愤 算 法 ， 使 目标 函数 


7 =imin 了 [yat 一 5 来 求 得 最 优 的 代表 隶属 函数 和 控制 规则 的 权重 值 。 





图 15. 3 优化 控制 系统 的 结构 图 

1]) 具有 模糊 远 辑 功能 的 神经 网 络 控制 器 GNFC 

具有 模糊 逻辑 功能 的 神经 网 络 控制 器 GNEFC 的 结构 如 图 15.3 中 虚 框 所 示 。 可 以 看 出 
它 是 一 个 有 具有 输入 层 、 中 间 层 和 输出 寂 的 三 宕 神经 网 络 。 该 神经 网 络 与 普通 神经 网 络 是 有 
很 大 不 同 的 。 在 结构 上 寺 ， 首 先 在 于 输入 层 的 非 全 联结 ， 从 图 中 可 以 看 出 ,站 和 各 自 对 
应 三 个 节点 ; 其 次 在 于 输入 层 的 标准 正 态 转移 函数 和 输出 层 的 线性 转移 函数 ， 最 后 在 于 中 
间 层 古 乘 社 器 而 非 严 格 的 神经 网 络 节 点 。 该 请 的 功能 是 将 来 自 输入 层 的 两 组 各 三 个 信息 的 
数据 两 两 相 乘 后 所 得 的 9 个 乘积 值 送 到 输出 层 。 

功能 上 ， 该 网 络 的 三 层 节点 是 严格 对 应 于 模糊 逻辑 控制 的 模糊 化 、 规 则 推理 和 逆 模 类 
三 个 步骤 的 ， 因 而 具有 明确 的 模糊 逻辑 意义 。 首 先 ， 网 络 输入 量 为 e 和 ee; 其 次 ， 输 入 
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层 节 点 的 转移 函数 代表 的 恰 为 模糊 变量 的 求 属 函数 。 该 层 的 权重 值 则 ) 和 6 的 不 同 也 就 意 


味 着 变化 多 端的 隶属 函数 的 形状 和 人 位置。 该 层 的 输出 癌 代 表 的 就 是 模糊 化 的 结果 一 隶属 
度 。 再 次 ， 中 间 层 是 将 模糊 化 得 到 的 束 属 度 两 两 相 乘 的 功能 。 中 间 层 的 输出 代表 着 9 个 模 
糊 规 则 的 规则 强度 ， 将 这 些 强 度 传递 给 下 一 层 就 可 以 进行 解 寞 糊 了 。 最 后 ， 输 出 层 的 各 个 
权重 值 22 代表 了 九条 规则 ， 根 据 重 心 法 的 解 模 糊 方式， 上 只 要 将 它们 作为 权重 值 与 输入 ， 
即 规则 强度 加 权 求 和 ， 输 出 即 为 模 精 控制 的 输出 量 。 此 处 采用 的 模 灶 推理 方式 为 代数 积 一 
加 法 一 重心 法 。 尽 管 这 种 推理 方式 的 模糊 逻辑 的 意义 相对 极 小 一 极 大 推理 方式 较 小 ， 但 是 
它 可 以 降低 推理 过 程 中 六 制 信息 的 损失 ， 同 时 又 更 容易 用 神经 网 络 米 实 现 。 
总 的 来 说 ，GNEC 的 输入 /输出 关系 可 以 归结 如 下 : 


世 =[e ec]7 (1 





人 = exp[ 玫 提亲 + 的 ) (15.2) 


和 -= 翰 - 观 -apCGg rong 有 real (5 


WOYO) -= 入 ? 思 .WO (15.4) 
三 ] 

其 中 三 12; 了 mm = 123: 天 =1.2，.…，9。 

如 果 脱 高 具 怀 的 神经 网 络 结构 ， 而 直接 采用 乘法 一 加 法 一 质心 法 的 推理 方式 和 正 态 隶 
属 函 数 ， 周 样 可 以 得 到 如 上 公式 。 之 所 以 如 此 ， 是 因为 经 过 这 样 的 从 模糊 还 辑 色 神经 网 络 
结构 的 映射 和 结合 ， 即 可 将 模糊 逐 畔 的 最 重要 的 参数 一 隶属 国 数 的 形状 和 位 置 ， 以 及 模糊 
规则 转化 成 神经 网 络 的 权重 值 ， 这 样 就 叮 以 利用 神经 网 络 的 自学 习 、 自 适应 能 力 来 修正 和 
优化 它们 ， 也 就 可 以 达到 优化 模 灶 膛 辑 控制 效果 的 目的 了 。 另 外 ， 对 于 该 系统 的 输入 输出 
我 们 作 了 归 一 化 的 处 理 ， 这 样 可 省 去 待 调 的 三 个 比例 因子 ， 而 将 它们 的 作用 和 调整 直接 纳 
入 到 了 神经 网 络 参数 中 ， 以 此 方式 该 网 络 可 以 优化 所 有 影响 模糊 逻辑 控制 效果 的 参数 值 ， 
因而 也 就 为 全 局 最 优 商 定 了 基础 。 此 时 ， 对 异 糊 控制 器 参数 的 优化 就 转化 为 对 神经 网 络 21 
个 可 调整 参数 的 优化 。 因 模糊 子 集 数 为 3 个 ， 寞 糊 规 则 为 9 个 ， 就 模糊 膛 租 控制 的 物理 实 
现 来 说 马达 到 最 少 。 

2) 用 于 过 程 模型 办 识 NNP 

图 45.3 中 的 用 于 过 程 模型 辨识 NNP 龙 用 来 辨识 被 控 对 条 的 输入 /输出 特性 ， 以 获得 
进行 控制 器 性 能 优化 所 需 的 被 控 对 象 的 模型 。 由 于 对 控制 器 参数 的 优化 过 程 采 用 的 大 间接 
法 ， 即 对 由 被 控 对 象 和 控制 器 串联 并 经 过 负 反 馈 所 组 成 的 闭环 回路 ， 采 用 期 望 输出 与 实际 
系统 输出 之 差 的 平方 和 作为 目标 函数 ， 以 此 来 确保 全 局 优化 质量 ， 这 样 ， 被 控 对 和 锭 的 输入 
/输出 特性 的 辨识 就 自然 成 为 控制 器 设 计 的 一 部 分 。 此 法 避免 了 由 直接 采用 控制 器 输入 / 输 ， 
出 数据 进行 训练 优化 所 带 采 的 非 最 优 函 数 的 逼近 问题 。 在 模型 辨识 上 为 了 获得 动态 特性 ， 
采用 含有 一 个 隐 含 层 且 带 有 输出 一 阶 延 迟 的 回馈 的 前 向 网 络 ， 网 络 内 部 结构 分 别 采 用 5 
型 和 线性 转移 函数 ， 并 通过 实验 选取 最 少 的 五 个 隐 含 节点 。 网 络 的 训练 采用 具有 自 适 应 学 
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习 速 率 的 BP 算法 ， 训 练 后 的 网 络 在 一 定 的 误差 范围 内 具有 实际 被 控 过 程 的 输入 /输出 特 
性 。 
对 于 GNRC 的 训练 可 以 采用 BP 算法 ， 但 是 由 于 其 中 间 层 是 一 乘法 器 ， 故 必须 对 BP 
算法 作 进 行 修正 后 方 可 使 用 ， 而 修正 后 的 BP 算法 不 仅 收 敏 速度 慢 ， 而 且 很 容易 陷入 局 部 
极 小 值 ， 因 此 ， 决 定 采 用 遗传 算法 〔GA》， 进行 优化 。 
3) 改进 的 寻 优 遗传 算法 
首先 将 所 辩 识 的 过 程 模型 与 待 求 的 神经 网 络 控制 器 相 串 联 ， 关 形成 负 友 馈 控 制 回路 ， 
再 利用 改进 的 遗传 算法 进行 运行 仿真 ， 以 寻求 得 到 模 勒 控制 中 的 最 优化 隶属 函数 积 控制 规 
则 的 组 合 控制 效果 。 
编码 : 首先 定义 包含 所 求 变 量 的 个 体 。 为 了 操作 方便 以 及 精度 的 需要 . 采用 实数 编码 ， 
交接 将 待 处 理 的 权重 值 逐 位 数字 地 颗 序 排列 ， 并 转化 成 数字 字符 串 ， 形 成 解 的 个 体 。 由 A 
个 个 体形 成 种 群 。 、 
适 配 值 : 适 配 估 本 数 号 采用 系统 的 期 望 答 出 与 实际 系统 的 输出 之 差 的 平方 和 梁 定 尺 ， 
即 : 


感 = 六 必 人 -py (5.3) 
天 一 | 灭 一 [ 


其 中 ,= 二 2. …， AN 为 种 群 中 的 个 体 数 ,上 为 个 体 中 待 求 变量 煞 。 优 化 的 巨 的 是 使 适应 
度 五 达到 某 个 满意 的 指标 。 

遗传 操作 : 在 复制 操作 中 ， 淘 汰 0.2$w 个 低 于 平均 适 配 值 的 劣 解 ， 并 以 随机 取 数 的 方 
式 补 齐 ， 以 保持 群体 交换 过 程 中 解 的 多 样 性 。 为 了 玫 保 搜索 的 全 局 最 优 ， 在 进行 交换 操作 
前 ， 首 先 将 本 代 样 本 中 的 最 优 解 直接 进化 到 下 一 代 中 。 除 此 之 外 ， 每 个 个 体 均 按 一 定 的 比 
例 两 两 进行 多 位 或 一 位 相互 交换 ， 以 形成 新 的 个 体 。 复 制 中 新 增补 的 随机 人 个体， 尤其 在 经 
过 数 代 进 化 后 ， 与 次 优 个 体 交 换 后 不 断 变 化 出 的 新 个 体 ， 可 以 有 效 地 延缓 早熟 的 出 现 。 

当 进 化 接近 最 优 解 对 ， 仅 由 交换 操作 产生 的 后 代 的 适 配 值 可 能 不 再 比 它们 的 前 辈 更 
好 ， 此 时 将 某 一 位 置 的 自然 数 变 为 另 一 自然 数 (不 同 于 标准 GA 中 改变 革 一 位 置 上 的 数字 )， 
上 自 的 是 为 了 增加 随机 性 ， 进 而 增加 多 样 性 。 另 外 ， 贿 郑 进 化 代数 的 增加 ， 进 行 突 变 的 比例 
也 随 之 增加 ， 以 便 在 接近 最 优 解 时 的 群体 中 增加 更 多 的 新 个 体 。 突 变 比例 在 整个 搜索 过 程 
中 由 0.05 变化 到 0.12。 

下 面 的 例子 可 以 很 好 地 说 明 交 换 操 作 和 变异 操作 的 过 程 。 例 如 : 个 体 中 两 个 变量 分 罚 
为 05712_ 和 -1.21327]， 当 它们 以 一 定 方式 被 选中 后 ， 取 后 三 位 小 数 进行 交换 ， 形 成 新 的 


数 0 有 27] 和 -1.2712， 然 后 通过 变异 操作 又 将 其 中 的 某 一 随机 数 ， 如 “2?， 即 0.5327 和 
-1.2712， 变 异 成 “3”， 则 形成 新 一 代 个 体 中 的 变量 : 0.5337 和 -13713， 变 异 操作 在 越 挟 
近 綦 优 值 、 交 换 操 作 趋 于 一 致 而 不 再 有 变化 时 ， 越 能 体现 出 它 的 重要 性 。 

通过 以 上 处 理 ， 控 制 系统 的 参数 优化 过 程 可 以 归纳 如 下 : 

号 训练 得 到 被 控 对 象 的 网 络 模型 NNP， 

他 根据 模糊 逻 每 拧 制 的 最 少 模糊 子 集 及 控制 规则 构造 神经 网 络 控制 器 GNRC; 

钨 将 NNP 与 GNRFC 联 成 闭环 回路 ， 并 采用 改进 的 遗传 算法 进行 参数 优化 。 
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15. 2.3 优化 仿真 结果 的 对 比 和 分 析 


用 于 控制 策 栈 验 证 的 仿真 系统 为 一 共有 重 非 线性 摩擦 广 的 直流 电机 速度 控制 系 
统 。 输 入 参考 信号 为 一 梯形 输入 。 我 们 将 GNEFC 控制 器 的 跟踪 效果 与 常规 PI 熔 制 器 以 及 
具有 5 个 论 域 、 采 用 三 角形 交叉 隶属 函数 ， 以 z = (e+ec) /7 2 为 控制 规则 的 模糊 逻辑 控制 
器 的 跟踪 效果 进行 了 比较 ， 图 15.4 即 为 三 者 的 跟踪 响应 ， 其 中 ， 图 15.4(b) 为 误差 响应 。 
从 图 中 可 以 看 出 ，GNFC 在 零 速 度 附近 表现 出 比 常规 控制 器 和 普通 的 模糊 逻辑 控制 器 均 佳 
的 由 非 线性 摩擦 力 所 造 成 的 难以 克服 的 跟踪 误差 ， 而 且 几 乎 达到 了 稳 态 误 盖 为 零 的 完美 程 
度 。 这 表明 它 可 以 周 时 兼顾 到 非 线性 特性 和 稳 态 精度 两 方面 的 要 求 。 
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图 15. 4 控制 系统 仿真 结果 对 比 图 

为 进一步 分 析 优 化 后 的 控制 器 性 能 ， 下 面 我 们 来 直观 地 看 一 看 优化 后 的 模糊 逻辑 的 隶 
属 函 数 图 及 控制 器 输入 /输出 特性 曲面 图 ， 它 们 分 别 如 图 15.5 和 图 15.6 所 示 。 从 图 15.5 
中 可 以 看 出 优化 后 的 隶属 函数 图 与 常规 的 一 些 人 为 设 定 的 录 属 函数 图 是 很 不 相同 的 ， 它 没 
有 均匀 的 分 布 性 ， 这 也 正体 现 了 优化 系统 针对 具体 被 控 对 象 优化 得 到 具有 具体 特点 的 隶属 
函数 的 功能 。e 和 ec 的 未 属 函 数 是 不 同 的 ， 并 且 各 自 都 有 特色 。 另 外 ， 每 一 模糊 子 集 的 
隶属 函数 的 伸展 宽度 是 不 一 样 的 有 的 绞 窑 ， 有 的 相当 宽 ， 几 乎 在 一 定 区 间 内 成 了 直线 。 
再 次 ， 这 些 孙 数 的 中 心 位 置 不 是 等 焉 的 ， 这 体现 了 优化 结果 的 丰富 性 。 

图 15.6 措 绘 的 是 优化 后 GNFC 的 输入 e 和 ec 与 输出 4 的 关系 图 ， 这 种 描述 更 直观 、 
形象 。 本 节 所 讨论 的 被 控 对 象 基 具有 严重 非 线 性 的 ， 这 一 点 怡 在 该 图 中 被 形象 地 体现 出 来 
了 ， 特 性 曲面 图 中 的 “上 峰 ” 与 “ 谷 ” 的 变化 代表 的 正 是 系统 所 固有 的 非 线性 。 从 这 -- 点 来 
说 , 优化 系统 不 需要 先 验 的 经 验 知识 , 它 可 以 通过 训练 自动 地 找 出 适应 系统 的 控制 特性 来 ， 
这 一 功能 无 疑 是 具有 重要 意义 的 。 从 图 中 还 可 以 看 出 , 在 e = ec =0 时， 图 15.6 中 的 世 为 
一 正 的 数值 。 我 们 知道 ， 速 度 系统 的 非 线性 摩擦 力 始 终 是 存在 的 ， 改 即使 误差 为 0 量 不 再 
变化 ， 为 了 维持 这 一 现状 ， 控 制 量 为 0 是 不 行 的 。GNFC 使 x 不 为 0， 符合 实际 的 情况 ， 
因而 其 稳 态 误差 自然 要 比 普 通 模糊 控制 器 要 小 得 多 。 另 外 ， 对 于 控制 量 在 零 速 度 附 近 也 有 
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较 大 的 差异 ， 这 可 以 从 它们 的 特性 骨 线 图 中 得 到 合理 的 解释 。 


一 一 一 一 一 一 
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15.6 输入 e 和 ee 与 输出 # 的 关系 图 
15. 2. 4 小 结 


本 节 给 出 并 讨论 了 一 种 模糊 神经 网 络 和 和 传 算法 相 结合 的 控制 策略 ， 通 过 设计 一 种 具 
有 模糊 逻辑 意义 的 神经 网 络 控制 器 ， 并 且 结合 遗传 算法 的 全 局 寻 优 特性 ， 完 成 了 对 模糊 逻 
辑 的 隶属 函数 的 形状 位 置 和 模糊 规 旭 的 最 优化 ， 并 且 在 数量 上 将 它们 降 到 最 低 。 针 对 非 线 
性 系统 所 作 的 优化 在 仿真 对 比 中 表 斑 出 了 较 常 规 控 制 器 和 普通 模糊 控制 器 好 的 多 的 控制 效 
果 。 通 过 观察 和 对 比 异 痢 逻辑 的 束 属 函数 和 输入 /和 输出 特性 曲面 图 ， 可 瘟 观 地 了 和 解 这 种 优 
化 控制 策略 的 真正 内 涵 ， 即 它 可 以 自动 提取 复杂 系统 的 内 在 特性 ， 通 过 优化 将 它 反应 到 模 
糊 有 辑 的 特性 之 中 ， 以 形成 一 个 针对 该 复杂 系统 的 最 优 控制 策略 。 


第 16 章 模拟 退火 算法 及 其 应 用 


不 论 是 神经 网 络 的 权 值 训练 ， 还 是 异 糊 神经 网 络 的 参数 优化 ， 不 论 是 采用 基于 梯度 下 
降 法 还 是 数值 优化 方法 进行 求解 ， 痢 存在 局 部 极 小 值 的 问题 第 14 章 所 讲 到 的 遗传 算法 
是 一 种 全 局 优化 算法 。 本 章 所 谈 的 模拟 退火 算法 (Simulated Annealing Algorithm, 简称 SAA) 
也 是 一 种 适合 解 大 规模 组 合 优化 问题 ， 特 别 是 解 NP 完全 问题 的 通用 有 效 的 金 局 优化 解 
活 ， 它 与 其 他 近似 算法 相 比 ， 具 有 描述 简单 、 使 用 灵活 、 运 用 广泛 、 运 行 效率 高 和 较 小 受 
初始 条 件 限 制 等 优点 ， 币 且 特 别 适 合并 行 运算 。 

模拟 退火 算法 是 将 组 合 优化 问题 与 统计 力学 中 的 热平衡 问题 类 比 ， 找 到 求解 优化 问题 
的 新 方法 。 对 固体 问题 进行 退火 时 ， 通 常 先 将 它 加 温 迷 化 ， 使 其 中 的 粒子 可 以 自由 运动 ， 
然后 随 着 温度 的 话 渐 下 降 ， 粒 子 也 笑 渐 形成 了 低能 态 的 品格 。 若 在 凝固 点 附近 的 温度 下 降 
足够 慢 ， 则 固体 物质 一 定 会 形成 最 低能 态 的 基态 。 对 于 组 合 优化 问题 米 说 ， 也 有 这 样 的 类 
似 过 程 。1982 年 ，Kirkpatrick 等 将 退火 思想 引入 组 合 优 化 领域 ， 提 出 一 种 解 大 规模 组 合 
优化 问题 ， 特 别 是 NP 完全 组 合 优化 问题 的 有 效 近似 算法 一 一 寞 拟 退 火 算法 。 它 通过 对 轩 
体 退 火 过 程 的 模拟 ， 采 用 Metropolis 接受 准则 ， 并 用 一 组 成 为 冷却 进度 表 的 参数 控制 算法 
进程 ， 使 算法 在 多 项 式 时 间 里 给 出 一 个 近似 最 优 解 。 


16.1 Metropolis 准则 和 模拟 退火 算法 


固体 在 恒定 温度 下 达到 热平衡 的 过 程 可 以 用 Monte Carlo 方法 进行 措 拟 。Monte Carlo 
方法 的 特点 是 算法 简单 ， 但 必须 大 芋 采 样 才能 得 到 比较 精确 的 结果 ， 因 而 计算 量 很 大 。 从 
物理 系统 倾向 于 能 量 较 低 的 状态 ， 而 热 运动 又 妨碍 它 准 确 落 入 最 低 态 的 原理 出 发 ， 采 样 时 
着 重 取 那 些 有 重要 贡 献 的 状态 ， 则 能 够 较 快 地 达到 较 好 的 结果 。 

1953 年 ，Metropolis 等 提出 了 重要 性 采样 法 。 他 们 用 下 述 方法 产生 固体 的 状态 序列 : 
先 给 定 以 粒子 相对 位 置 表征 的 初始 状态 半 ， 作 为 同体 的 当前 状态 ， 该 状态 的 能 量 是 百 ， 然 
后 用 摄 动 装置 使 随机 选取 的 某 个 粒子 的 位 移 随 机 地 产生 一 个 微小 的 变化 ， 得 到 一 个 新 状态 
7， 新 状态 的 能 量 是 互 ， 如 果 豆 < 五 ， 则 该 新 状态 就 作为 “重要 ” 状态 ， 如 果 已 > 五 ， 则 
考虑 到 热 运动 的 影响 ， 则 该 新 状态 是 否 可 作为 “重要 ” 状态 ， 要 依据 固体 处 于 该 状态 的 
几率 来 判断 。 而 固体 处 于 状态 了 和 了 的 几率 的 比值 等 于 相应 Boltzmann 因子 的 比 香 忆 ， 即 : 


五 ,一 百 ， 
忆 =exp( 一 一 一 ) 《16.1) 
有 了 


其 中 ， 已 是 一 个 小 于 工 的 数 。 

用 随机 数 发 生 器 产生 一 个 [0.1] 区 间 的 随机 数 random， 若 己 > random， 则 新 状态 作为 
重要 状态 ， 和 否则 售 去 。 若 新 状态 j 足 乎 要 状态 ， 就 以 了 取代 成 为 当前 状态 ， 否 则 仍 以 ; 
为 当前 状态 。 重 复 以 上 新 状态 的 产生 过 程 ， 在 经 过 大 量 轩 体 状态 的 如 此 变换 后 ， 系 统 乏 渐 
趋 于 能 量 较 低 的 平衡 状态 ， 周 体 状 态 的 概率 分 布 趋 于 指数 形式 的 正则 分 布 。 
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上 述 接受 新 状态 的 准则 称 为 Metropolis 准则 ， 相 应 的 算法 称 为 Metropolis 算法 。 

1982 年 ，Kirkpatrick 等 首先 意识 到 固体 退火 过 程 与 组 合 优化 问题 之 闽 存 在 的 类 似 性 ， 
加 上 Metropelis 等 对 固体 在 恒定 温度 下 达到 热平衡 过 程 的 模拟 也 给 他 们 以 启迪 : 应 该 把 
Metropolis 准则 引入 到 优化 过 程 中 来 。 最 终 他 们 得 到 一 种 对 Metropolis 算法 进行 选 代 的 组 
合 优化 算法 ， 这 种 算法 模拟 固体 退火 过 程 ， 称 之 为 “模拟 退火 算法 ” 

模拟 退火 算法 的 求解 过 程 如 下 : 

设 组 合 优 化 问题 的 一 个 解 芋 及 其 一 个 目标 函数 .7zD 分 别 与 头 体 的 一 个 微观 状态 庆 及 其 能 
量 瓦 等 价 ， 令 随 算法 进程 递减 其 值 的 拧 制 参数 ! 担当 固体 退火 过 程 中 的 温度 7 的 角色 ， 
则 对 于 控制 参数 # 的 每 一 个 取 值 ， 算 法 持续 进行 “产生 新 解 一 判断 一 接受 / 舍 取 ”的 选 代 
过 程 就 对 应 者 固体 在 某 一 恒定 温度 下 趋 手 热平衡 的 过 程 ， 也 就 是 执行 了 一 次 Metropolis 算 
法 。 与 Metropolis 等 法 从 某 一 初始 状态 出 发 ， 通 过 计算 系统 的 时 间 演 化 过 程 ， 求 出 系统 达 
到 的 状态 相似 ， 模 所 退火 算法 从 某 个 初始 解 出 发 ， 经 过 大 量 解 的 变换 后 ， 可 以 求 得 给 出 控 
制 参数 值 时 组 合 优化 问题 的 相对 最 优 解 。 然 后 减 小 控制 参数 + 的 值 ， 重 复 执行 Metropolis 
算法 ， 就 可 以 在 控制 参数 f 赵 于 零 时 ， 最 终 求 得 组 合 优化 问题 的 整体 最 优 解 。 由 于 固体 退 
火 必 须 “ 徐 徐 ” 降 泊 ， 才 能 使 固体 在 每 一 温度 下 部 达到 热平衡 ， 最 终 趋 于 能 量 最 小 的 基态 ， 
控制 参数 的 值 世 必须 缓慢 衰减 ， 才 能 确保 模 执 退火 算法 最 终 趋 于 组 合 优化 问题 的 整体 最 优 
解 。 理 论 上 已 经 证 明 : 模拟 退火 算法 以 1 的 概率 收 和 你 到 整体 最 优 解 集 ， 但 渐 近 收 敏 到 最 优 
解 集 须 经 历 无 数 次 变换 。 模 拟 退 火 算法 的 崭 近 收 和 伍 性 意味 着 : 对 于 多 数组 合 优化 问题 来 说 ， 
它 是 一 种 指数 型 时 间 算 法 ， 算 法 的 执行 过 程 只 有 进行 无 限 多 次 变换 后 ， 才 能 返回 一 个 整体 
最 优 解 。 为 了 能 够 在 有 限时 间 里 获得 一 个 较 优 的 解 ， 人 们 引入 了 冷却 进度 表 (cooling 
schedule)。 冷 却 进 度 表 是 一 组 控制 算法 进程 的 参数 ， 用 以 逼近 模拟 退火 算法 的 渐 近 收 伍 性 
态 ， 使 算法 在 胆 限时 执行 过 程 后 返回 一 个 近似 最 优盘 。 因 而 冷却 进度 表 是 影响 模拟 退火 算 
法 实验 性 能 的 重要 因素 ， 其 合理 的 选取 是 算法 应 用 成 败 的 关键 。 


16.2 模拟 退火 算法 的 设计 步骤 


模拟 退火 算法 应 用 的 一 般 步 骤 是 : 从 选 定 的 初始 解 开 始 ， 在 借助 于 控制 参数 ! 不 断 递 
减 的 过 程 中 产生 的 一 系列 Mapkob 链 中 ， 利 用 一 个 新 解 产生 装置 和 接受 准则 ， 重 复 进 行 包 
括 “ 产 生 新 解 一 计算 目标 函数 差 一 判断 是 否 接受 新 解 一 接受 〈 或 舍 取 ) 新 解 ” 这 四 个 过 程 ， 
不 断 对 当前 解 进 行 选 代 ， 从 而 达到 使 目标 函数 最 优 的 月 标 。 因 此 ， 算 法 的 应 用 需 满足 以 下 
三 个 方面 的 要 求 。 

1) 数学 寞 型 : 由 解 空间 、 目 标 孙 数 和 初始 解 三 部 分 组 成 

和 解 空 间 ;: 它 为 问题 的 所 有 可 能 《可 行 的 或 不 可 行 的 》 解 的 集 含 ， 它 限定 了 初始 解 选 取 
和 新 解 产 生 的 范围 。 在 许多 组 合 优化 问题 中 ， 一 个 解除 了 满足 目标 最 优 的 要 求 外 ， 还 必须 
满足 一 组 约 刘 ， 因 此 在 解 集中 往往 可 能 包含 一 些 不 可 行 解 ， 为 此 ， 可 以 限定 解 空间 仅 为 所 
有 可 行 解 的 集合 ， 即 在 构造 解 时 就 普 虑 到 对 解 的 约束 ， 这 可 以 通过 在 目标 函数 中 加 上 所 谓 
的 惩罚 函数 以 “惩罚 ” 不 可 行 解 的 出 现 。 

目标 函数 : 组 合 优化 问题 的 日 标 是 从 组 合 问题 的 可 行 解 集中 求 出 最 优盘。 优化 问题 有 


225 





-一 


三 个 基本 要 素 ， 变量 、 约 束 和 目标 函数 。 在 求解 过 程 中 选 定 的 基本 参数 称 为 变量 ， 对 变量 
取 值 的 种 种 限制 称 为 约束 ， 麦 示 吉 行 方案 衡量 标准 的 函数 称 为 目标 函数 。 目 标 函 数 是 对 问 
题 的 优化 目标 的 数学 描述 上 六 道 常 表述 为 若 于 优化 日 标的 一 个 和 式 。 目 标 函 数 的 选取 必须 
正确 体现 对 问题 的 整体 优化 要 求 。 例 如 ， 如 上 所 述 ， 当 解 空 间 包 含 不 可 行 解 时 ， 目 标 函 数 
2 对 不 可 行 解 的 惩罚 国 煞 项 ， 借 此 将 一 个 有 约束 的 优化 问题 转化 为 无 约束 的 优化 问 

。 一 般 地 说 ， 目 标 函 数 常 常 是 一 个 误差 函数 的 平方 和 ， 不 过 ， 目 标 函 数 也 不 一 定 就 是 问 
同人 化 目标 但 其 对 应 关系 应 是 明 灵 的。 此外， 目标 函 数 式 应 当 是 易于 计算 的 。 

初始 解 : 它 是 算法 开始 迭代 的 起 点 。 初 始 解 的 选取 应 当 使 得 算法 导出 较 好 的 最 终 解 。 
不 过 大 量 实验 表明 ， 模 拟 退 火 算法 的 最 终 解 并 不 十 分 依赖 初始 解 的 选取 。 

2 ) 新 解 的 产生 和 接受 机 制 

新 解 的 产生 和 接受 可 分 为 以 下 四 个 步 双 : 

首先 ， 由 一 个 产生 装置 从 当前 解 空 间 中 产生 一 个 新 解 。 为 便于 下 面 的 计算 和 接受 
正 是 算法 中 最 耗 时 的 工作 ?， 通 常 选 择 由 当前 和 解 经 过 简单 变换 即 可 产生 新 解 的 方法 ， 
构成 解 的 全 部 或 部 分 元 素 进行 置换 、 互 换 等 。 

次 ， 计 算 与 新 解 伴随 的 日 标 函 数 的 差 。 

第 三 ， 判 断 新 解 是 否 被 接受 。 判 断 的 依据 是 一 个 接受 稚 则 。 最 常用 的 接受 准则 是 

Metropolis 准则 ， 即 





L Ar <0 
-| -AryD， Arz0 
中 ，! 为 控制 参数 ， 好 为 新 解 与 当前 和 解 之 间 的 目标 函数 差 。 
最 后 ， 当 新 解 被 确定 接受 时 ， 用 新 解 代 蔡 当前 解 。 此 时 ， 当 前 解 实现 了 一 次 选 代 。 可 
在 此 基础 上 开始 下 一 次 新 的 欠 代 。 如 果 所 获 新 解 被 判定 为 舍弃 时 ， 那 末 在 原 当前 解 的 基础 
土 继续 进行 下 一 次 新 的 选 代 。 
3 冷却 进度 表 
它 是 用 于 控制 算法 进程 的 一 组 参数 的 集合 ， 包 括 榨 制 参 数 的 初始 值 及 其 衰减 函数 、 对 
应 的 Mapkob 链 的 长 度 和 停止 准则 。 冷 却 进度 表 的 选取 是 算法 性 能 的 主要 因素 。 
下 面 将 结合 采用 模拟 退火 算法 求解 TSP 问题 的 具体 实例 ， 详 细 解 释 应 用 横 拟 退 火 算 
法 解决 实际 问题 时 必须 考虑 的 方面 。 


《16.2) 





16.3 应 用 模拟 退火 算法 来 解 TSP 问题 


模拟 退火 算法 实际 上 是 一 种 随机 搜索 算法 ， 即 它 在 一 定 的 解 空间 内 随机 地 产生 新 解 并 
对 其 进行 取舍 。 所 不 同 的 是 ， 对 一 个 求 目 标 函 数 最 小 值 的 问题 ， 一 般 的 随机 搜索 算法 根据 
新 解 对 应 的 肯 标 函数 值 是 否 减 小 来 判断 是 否 接受 新 解 ， 府 模拟 退火 算法 则 允许 接受 使 目标 
函数 增 大 的 新 解 ， 其 优点 在 于 能 卡 出 局 部 极 小 值 ， 有 利于 找到 全 局 最 小 值 。 

模拟 退火 算法 的 核心 是 在 获得 新 解 丸 后 ， 根 据 一 定 的 准则 产生 新 解 的 接受 概率 己 ， 
如 取 Metropolis 准则 ， 新 解 的 接受 概率 如 (16.2) 式 所 示 ， 可 重 写 如 下 为 : 


226 


1， 方 Sj 
ec 区 力 六 >/ (16.3) 
其 中 ，! 是 已 知 解 ， 了 是 新 产生 的 解 。 

当 六 > 万 时 ， 这 要 进行 如 下 判断 : 随机 产生 一 个 服从 (03) 的 随机 变量 random, 车 六 六 
random 则 接受 六 ， 否则 不 接受 。 这 样 处 理 的 好 处 是 : 倘若 我 们 将 满足 斤 等 天 的 解 了 称 为 好 
解 ， 将 满足 厂 > 二 的 解 称 为 坏 解 ， 那 么 采用 Metropolis 准则 ， 可 以 使 我 们 在 导 找 好 解 的 过 
程 中 允许 接受 坏 解 ， 从 而 能 在 一 定 程 度 上 避免 陷入 局 部 极 小 值 。 

在 模拟 退火 算法 的 求解 过 程 中 ，# 十 一 个 不 断 减 小 的 拧 制 参数 ， 随 着 + 的 减 小 ， 坏 解 
被 接受 的 概率 就 越 小 。 当 ! 足够 小 之 后 ， 模 拟 退 火 算 法 就 变 成 了 纯粹 的 随机 搜索 算法 ， 从 
击 保 证 了 求解 过 程 的 收 敏 性。 倘若 将 产生 并 接受 一 个 新 解 称 作 一 次 变换 ， 模 拟 退 火 算法 可 
以 简单 地 描述 为 : 在 控制 参数 一 定 的 情况 下 ， 经 过 无 限 次 的 变换 ， 算 法 得 到 一 个 稳 态 值 ; 
随 省 控制 参数 从 一 个 较 大 的 值 逐 新 变 为 0， 这些 称 态 值 最 终 将 收 仇 于 问题 的 最 优 佣 。 因 此 ， 
从 理论 上 说 ， 蛋 拟 退 火 算法 是 一 种 最 优化 算法 ， 但 是 实际 上 ， 模 拟 退 火 算法 并 不 能 在 多 项 
式 时 间 内 求 得 优化 问题 的 最 优 解 。 这 并 不 意味 着 模拟 退火 算法 设 有 实际 意义 ， 根 据 模 拟 退 
火 算法 的 原理 ， 我 们 可 以 在 多 项 式 时 间 里 对 模拟 退火 算法 的 渐进 性 态 进行 逼近 ， 从 而 得 到 
问题 的 近似 最 优 解 。 


16. 3. 1 TSP 问题 的 求解 步骤 


现 以 旅行 商 (TSP) 问 题 为 例 米 说 明 在 实现 模拟 退火 算法 的 过 程 中 需要 考虑 的 问题 。 

设 有 - 个 城 市 和 距离 托 阵 忆 = [ 辐 ， 其 中 ， 由 表示 城市 ;到 城市 /的 距离 ， 
了 =12… ,aa。 问 题 是 要 找 裔 访 每 个 城市 恰好 一 次 的 一 条 回路 ， 且 其 路 径 长 度 为 最 短 。 

采用 民 拟 退火 算法 求解 的 描述 如 下 : 

防 解 空间 

用 懂 拟 退火 算法 求解 TSP 的 解 空间 $ 可 表示 为 由 2……, 对 的 所 有 镀 环 排列 的 集合 ， 即 

S= 恢 ，F 人 雯 全 ,,，z 葛 循环 排列 } (16.4》 

其 中 ， 每 一 循环 排列 表示 通 访 * 个 城市 的 一 条 回路 ，#; = 了 表示 在 第 ;个 次 序 访问 城市 六 

丸 目标 函 数 

对 于 此 问题 的 自 标 数 可 选 为 ， 访问 所 有 城市 的 路 径 长 度 ， 吕 


了 Cr = >aon， (16.5) 


目的 是 求 上 述 目标 函数 的 最 小 仁 。 解 中 约定 元， 初始 解 可 选 为 (2,…-, 站 。 
3 新 解 的 产生 
在 叙述 新 解 产 生 的 方法 之 前 ， 我 们 先 定 义 一 个 TSP 的 下 变换 领域 如 下 ， 
定义 16.1 〈TSP 的 上 变换 领域 从 > 2) ) 设 吕 是 一 个 大 变换 领域 结构 ， 则 大 恋 换 颁 
域 定 义 为 :wx(D={17eSl7 坷 由; 径 一 次 k 变 换 得 到 ， 其 中 守 和 分别 是 给 定 的 实例 的 两 个 
不 同 的 解 。 
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所 谓 大 变换 是 将 了 对 应 的 路 径 去 卸 天 条 按 ， 然 后 用 另外 关 条 边 放 入 ， 以 得 到 了 对 应 的 
路 径 。 

新 解 可 通过 分 别 或 交 奉 使 用 以 下 两 种 方法 来 产生 。 

(2 变换 法 

任 选 两 个 城市 的 访问 序号 和 W 设 < 太 ， 逆 转 上 和 Yv 之 间 的 访问 顺序 ， 得 到 : 


邢 1 开 i-1，, 克 w 开 vl 下 +1: 殉 4 和 PH 


2 变换 的 令 域 规模 是 ， 日 = 了 (z- De- 2 。 

{ 23 变换 法 

任 选 序号 z vv 和 masyr<m)， 将 xz 和 vv 之 间 的 路 径 播 到 w 之 后 访问 ， 得 到 新 的 路 
径 为 : 


邢 1， ,从 p1 开 HH 下 bH3 下 开 5, 开 下 可 1 邢 r 


3 变换 的 邻 域 规模 是 ，@= 了 COz-DO-2)0 -3) 。 


不 论 用 2 变换 法 还 是 用 3 变换 法 ， 新 解 的 产生 概率 都 服从 均匀 分 布 。 

必 目 标 通 数 差 

由 516.5) 式 已 知 TSP 问题 的 目标 函数 的 定义 。 为 避免 重复 计算 ， 同 时 提高 计算 效率 ， 
不 需要 计算 每 个 新 产生 的 解 所 对 应 的 日 标 函 数值 。 计 算 两 个 解 所 对 应 的 日 标 函 数值 的 差 更 
容易 。 下 面 根据 不 同 的 情况 来 讨论 新 解 与 旧 解 的 目标 函数 差 〈 设 了 为 旧 解 ，/ 为 新 解 )。 

(对 于 用 2 变换 法 产生 新 解 的 情况 


丸 = 廊 一 声 = (dr mr 十 eta ) 一 《Gm um 二 Crmotl 》 
(2 对 于 半 3 变换 法 产生 新 解 的 情况 
纪 = 广 加 撕 一 (Sm 十 dr 十 dx ) 一 (rirs 十 Gamrorl +drumrwl) 


实际 上 ， 对 于 3 变换 法 产生 新 解 的 情况 ， 由 于 计算 娘 所 需 判 断 的 条 件 太 和 多， 效率 来 
必 比 直接 计算 新 解 的 目标 函数 值 高 ， 所 以 在 本 鲍 应 用 时 是 查 接 计算 新 解 对 应 的 目标 函数 的 
值 。 

53 新 解 接 爱 的 判断 委 件 

接受 准则 有 和 殷 多 种 ， 所 采用 的 是 Metropolis 准则 。 设 乌 表 示 由 旧 解 了 产生 新 解 产 解 
了 的 接受 概率 值 由 (16.3) 式 决定 。 


16. 3. 2 冷却 进度 表 的 选取 
模拟 退火 算法 渐进 收敛 性 的 有 限时 间 腺 近 通 常 采用 以 下 方法 来 实现 ， 月 掠 制 参数 1 的 


一 个 递减 有 限 序列 { A}， 天 = 012.….， 以 及 与 之 对 应 的 链 长 为 五 的 有 限 长 齐 次 Mapkob 
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rnivaaareeicemamee 人 一 一 一 一 一 一 一 -一 一 一 一 -一 一 -一 


< 


链 序 列 去 控制 算法 进程 。 算 法 中 涉及 到 的 一 些 参数 总 称 为 冷却 进度 表 ， 它 包括 如 下 参数 : 

钙 和 控制 参数 : 的 初 值 轧 : 

全 控制 参数 ! 的 衰减 函数 ; 

含 控 制 参数 : 的 终 值 (停止 准则 ); 

全 Mapkob 链 的 长 度 瑟 。 

显然 ， 冷 却 进度 表 的 选取 对 算法 而 言 古 至 关 重 要 的 。 下 面 就 上 述 几 个 参数 的 逃 取 一 一 
进行 讨论 。 

了 控制 参数 上 的 初 值 和 

控制 参数 : 的 初 值 癌 的 选取 原则 是 使 算法 开始 时 接受 坏 解 的 概率 尽量 大 ， 这 就 要 求 往 
应 该 选 得 足够 大 。 使 最 初 的 扰动 在 此 温度 时 能 触 充分 接受 ， 同 时 使 系统 处 于 最 无 译 状 态 ， 
以 模拟 物质 在 高 温 时 的 混乱 状态 。 得 也 不 能 无 节制 地 取得 太 大 ， 这 样 会 导致 算法 在 高 温 时 
停留 过 长 ， 增 加 了 算法 的 执行 时 间 。 

已 有 不 少 逃 取 为 的 方法 ， 下 面 采 用 Aarts 等 人 提出 的 方法 : 

先 对 控制 参数 的 某 个 确定 的 值 产生 一 个 六 次 党 试 的 序列 ， 记 mm 和 ma 分 别 为 目标 函 
数 减 小 和 增 大 的 变换 数 ，A 产 是 mm 次 目标 函数 增 大 变换 的 平均 增 量 。 设 定 平 均 接受 概率 
值 Y， 则 Y 满足 : 





二 mexpC- 鼻 站 (16.6) 
731 十 及 > ” 
这 样 ，z5 就 可 以 求 得 : 
十 
nm- 一 已 {16.7) 
ln mm2 
了 2 区 一 IPT 人 L 一 区 ) 


只 要 将 % 设置 为 初始 接受 率 ， 就 能 求 出 相应 的 种 值 。 初 始 接受 率 常 取 值 为 0.9。 

2) 控制 参数 上 的 衰减 孙 数 

选择 一 个 好 的 冷却 速率 的 控制 参数 : 也 是 很 重要 的 。 由 于 降温 过 程 中 ， 系 统 能 量 的 下 
降 是 平稳 的 ， 因 面 在 系统 能 量 下 降 剧 烈 的 地 方 ， 应 适当 放 慢 冷 却 速 度 ， 使 系统 达到 平衡 。 
更 论 上 证 明 ，! 以 对 数 的 导数 下 降 时 ， 效 果 最 好 。 在 本 实验 中 所 选取 的 衰减 函数 是 : 


基 
了 二 一 一 一 《 16.87 
1 1 人 In(L+ 人 ) 


4 

其 中 ，6 是 一 个 接近 0 的 正 的 小 量 ， 2 是 第 大 个 Mapkob 链 的 目标 函数 值 的 方差 。 

这 种 衰 成 函数 的 特点 十， 开始 时 上 下 降 很 缓慢 ， 越 往 后 f 下 降 越 快 。 这 对 于 求 得 全 局 
最 小 值 是 有 利 的 ， 因 为 开始 时 ，f 下 隆 很 组 惕 ， 有 利于 算法 尝试 不 同 收 伍 域内 的 解 ， 而 越 
往 后 ，! 下 降 越 快 ， 使 得 算法 能 以 较 快 的 速度 收 伍 。 

拉 控 制 参 数 二 的 终 值 ( 停 士 准则 ) 

一 般 在 接近 0 点 时 ， 连 续 几 次 降温 后 ， 如 能 量 设 有 明显 变化 ， 则 终止 算法 。 在 本 实验 
中 选取 的 停 下 准则 是 ， 出 现 连 续 * 个 Mapkob 链 的 结果 不 变 的 情况 。 应 用 中 要 注意 的 昆 ， 
当 问 题 的 规模 增 大 时 ， 应 及 时 调节 s 的 值 ， 否 则 会 导致 求解 时 间 过 长 。s 一 般 小 于 2。 
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习 Mapkob 链 的 长 度 工 
根据 Aarts 等 人 定义 的 准 绊 衡 条 件 ， 当 在 点 之 上 达到 准 平衡 ， 则 在 入， 上 的 准 平衡 只 
需要 进行 少量 变换 就 可 迅速 逼 近 。 如 何 定 义 “ 少 量变 换 ”? Aatts 等 人 指定 : 该 “少量 ” 
基 指 算法 能 以 充分 大 的 概率 至 少 访 癌 给 定 解 的 大 部 分 邻 域 所 希 进 行 的 变换 次 数 。 并 且 他 们 
证 明 ， 对 基数 为 13| 的 集合 进行 交 次 重复 取样 ，3 中 不 同 元 素 被 选中 的 期 望 概率 在 六 和 | 引 
为 大 值 时 ， 可 近似 为 : 
1 


根据 以 上 原理 ， 可 将 工 取 为 问题 的 邻 域 规模 日 。 但 在 编程 实现 中 ， 由 于 采用 是 2 变 
换 和 3 变换 随机 轮流 产生 新 解 ， 亏 值 大 ， 理 论 上 有 利于 向 题 最 优 解 的 求 得 ， 但 是 实际 上 
将 花费 很 长 的 时 间 。 同 时 ， 随 着 问题 规模 的 增 大 ， 外 增 大 很 快 ， 这 对 于 求解 是 不 利 的 。 
因此 ， 在 实际 的 求解 过 程 中 ， 所 采取 的 是 将 王 到 为 2 变换 的 邻 域 规模 。 


由 以 上 步骤 可 得 模拟 退火 算法 的 运算 过 程 如 下 。 

心 取 初始 值 : 有 有 

外 产生 新 解 /: 

二 计算 目标 函数 差 ; 

风 判 断 是 否 接受 新 解 ， 若 不 接受 ， 则 转 回 第 四 步 ; 

包 接 受 新 解 ， 判 断 链 长 是 否 达 到 五 ， 若 没有 ， 则 返回 第 人 @ 步 ， 
时 减 小 控制 参数 上 ， 重 复 步骤 他 -后 ， 

包 判 断 是 否 满足 停 上 规则 ， 若 不 满足 则 返回 第 @@ 步 。 


16.3.3 求解 TSP 问题 的 程序 实现 


我 们 已 在 MATLAB 环境 下 的 SIMULINK 中 ， 将 上 述 利用 模拟 退火 算法 求解 TSP 问 
题 用 图 解 和 程序 实现 ， 并 实际 求解 出 来 。 道 过 运行 程序 ， 可 以 进行 任意 节点 之 间 的 TSP 
的 求解 及 其 图 解 。 下 面 首先 介绍 一 下 程序 的 界面 。 应 用 程序 的 名 宁 为 SAA4tsp.m， 它 是 用 
MATLAB 语言 编制 的 ， 该 程序 的 界面 她 图 16.1 所 示 。 

图 16.1 中 标签 的 意义 如 下 ， 

(9 动态 显示 求解 过 程 中 所 产生 的 路 径 ， 控 制 参 数 改 变 一 次 ， 该 图 更 新 一 次 。 

人 2 最终 的 结果 ， 包 括 求 得 的 最 短路 程 、 求 解 过 程 中 总 共 接 受 的 变换 次 数 。 

(3) 城 市 数 日 。 

( 获 得 城市 坐标 和 城市 间距 离 的 方式 。 城 市 坐标 用 一 个 站 X2 的 撼 阵 表示 ， 并 且 在 程 
序 中 将 其 命名 为 妆 ， 城 市 间 的 距离 矩阵 用 靖 Xz 的 矩阵 表示 ， 变 量 和 名 为 Dis。 该 下 拉 菜 单 
有 三 个 选项 : 
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The minimum distance is 2.14119: 
25 ransforms have been accepted- 








图 16.1 求解 TSP 的 界面 图 


CRandom"， 程 序 将 随机 自动 产生 指定 数 骨 的 城市 公 标 ， 并 计算 出 相应 的 距离 矩阵 ; 

G)*xydatamat"， 程 序 将 从 该 文件 中 提取 城市 坐标 变量 《〈 苞 )。 车 该 文件 中 含有 瑟 离 矩 
阵 变量 (Dis)， 则 程序 直接 调用 该 变量 的 值 ， 否 则 ， 程 序 将 根据 闻 计算 出 Dis。 程序 在 得 
出 最 终结 果 或 被 终止 时 将 把 变量 z 和 Bis 保存 在 该 文件 中 。 

GOthers.."”， 指 定 程序 从 其 他 文件 中 提取 有 关 城 市 坐标 和 曝 离 矩阵 的 信息 ， 该 文件 
中 必须 有 好 变量 

(5) 初 始 接受 概率 X 【应 当 尽 量 接近 1)。 

(名 为 计算 控制 参数 初始 值 而 需要 的 尝试 变换 次 数 《my)。 

(7) 停 止 准则 : 连续 m 个 Mapkob 链 的 结果 不 变 则 整个 计算 停止 。 

(8)Mapkob 链 的 长 度 开 采 用 2 变换 的 规模 还 是 3 变换 的 规模 。 如 前 所 述 ， 当 世 取 问题 
的 邻 域 的 规模 时 ， 我 们 能 尽 可 能 地 取 到 该 邻 城内 的 所 有 值 。 但 是 ， 该 程序 采用 2 变换 和 3 
变换 交替 产生 新 解 ， 因 此 工 的 取 值 就 成 为 一 个 问题 。 实 际 应 用 时 将 其 简单 化 为 或 者 取 2 
变换 的 邻 域 规模 ， 或 者 取 3 变换 的 邻 域 规模 。 当 碟 取 3 变换 的 邻 域 规模 时 ， 计算 时 间 比 
互 取 2 变换 的 邻 域 规模 时 所 需 时 间 长 ， 但 是 解 的 质量 高 。 

(9) 控 制 参数 上 的 变化 情况 。 

(0) 当 前 的 控制 参数 值 。 图 16.1 中 所 显示 的 当前 的 控制 参数 值 为 0， 整个 图 形 所 表示 
的 路 径 是 在 上 一 个 控制 参数 控制 之 下 获得 的 最 终 解 。 

程序 在 退火 完成 时 或 被 用 户 终止 时 ， 将 自动 产生 两 个 “.mat ”文件 :xdatamat， 
resultmat。“xydatamat” 中 保存 两 个 变量 ; Dis (距离 矩阵 ) 和 芒 〈 城 市 华 标 )。“Tesultmat 
中 保存 3 个 变量 :fcell、taAray 和 rm。 其 中 ,“fCell” 是 一 个 cell 变量 ， 它 保存 了 退火 过 
程 中 所 有 产生 并 被 接受 了 的 解 所 对 应 的 目标 函数 值 ，tArray 是 一 个 向 量 ， 它 保存 了 控制 参 
数 在 退火 过 程 中 的 所 有 取 值 ;“ro” 是 程序 结束 时 得 到 的 路 行 。 


16. 3. 4 模拟 退火 算法 的 性 能 对 比 


模拟 退火 算法 在 解 次 优化 问题 上 是 一 种 有 效 的 方法 。 与 第 4 章 中 利用 连续 Hopfield 
网 络 CCHNN) 求解 TSP 相 比 ， 采 用 模拟 退火 算法 有 以 下 优 扣 : 

作 模 拟 退 火 算法 不 依赖 于 初始 和 解 。 尽 管 模拟 退火 算法 在 开始 时 需要 产生 一 个 初始 解 ， 
但 是 由 于 它 在 求解 过 程 中 能 接受 坏 解 ,因此 它 不 会 局 限于 初始 解 所 在 的 收敛 域内 .而 CHNN 
财 依 赖 于 初 冶 和 解 ， 当 问题 的 能 量 函数 的 “地 形 ” 凹 凸 不 平时 ，CHNN 得 到 的 结果 只 能 位 
于 初始 解 所 在 的 收敛 域内 。 下 面 以 10 个 城市 为 例 进行 一 些 比较 《所 用 的 城市 坐标 以 及 距 
. 离 上 矩阵 等 数据 与 第 4 章 图 4.15 的 数据 相同 )。 

图 16.2 的 结果 是 该 问题 的 最 优 解 。 采 用 SAA 很 容易 就 得 到 庶 解 ， 相 比 之 下 ，CHNN 
则 要 花费 很 长 时 间 ， 还 不 能 保证 一 定 能 取 到 该 解 。 图 16.3 和 图 16.4 是 从 两 种 不 同 初 始 值 
得 到 相同 最 优 的 结果 的 过 程 中 目标 函数 〈 或 能 量 函 数 ) 的 变化 曲线 。 尽 管 这 两 幅 图 不 能 全 
面 地 说 明 问 题 ， 但 是 它们 还 是 能 反映 出 两 种 方法 的 特点 。 甚 一， 图 16.3 的 曲线 比 几 16.4 
的 曲线 波动 频繁 ， 其 二 ， 图 16.3 的 曲线 的 波动 范围 比 图 16.4 的 大 。 这 两 点 都 说 明了 模拟 
退火 算法 的 求解 比 CHNN 有 更 大 的 选择 性 ， 对 于 初始 值 则 有 更 小 的 依赖 性 。 


有 
The minimum distanceis 30.97 
517itranstorms have been accepted. 


图 16.2 SAA 得 出 的 结果 《10 个 城市 的 TSP 问题 ) 





@@ 模 拟 退 火 算法 得 到 的 解 虽 然 不 一 定 是 最 优 解 ， 但 一 定 是 全 局 的 次 优 和 解 。 原 因 在 于 ， 
它 在 计算 过 程 中 ， 坯 解 始 终 都 有 可 能 被 捷 受 ， 这 使 得 算法 能 跳出 局 部 极 值 的 陷阱 。CHNN 
则 不 能 跳出 局 部 极 值 的 陷 际 。 也 就 是 说 ，SAA 比 CHNN 的 解 的 质量 高 ， 更 有 可 能 得 到 全 
局 最 优 值 。 
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图 16. 3 求解 过 程 中 目标 函数 的 变化 图 16.4 求解 过 程 中 目标 函数 的 变化 
曲线 (SAA) 曲线 CCHNN) 


合 模 拟 退 火 算 法 是 在 问题 的 解 空 间 内 不 断 产生 新 解 、 决 定 取舍 、 不 断 用 新 解 取代 旧 解 
从 而 最 终 得 到 问题 的 一 个 〈 次 ) 优 解 。 即 SAA 所 产生 的 解 至 少 都 是 问题 的 可 行 解 。CHNN 
是 在 连续 的 解 空间 内 搜索 ， 这 其 中 涉及 到 的 解 不 一 定 是 原 问 题 的 可 行 解 。 因 而 ，CHNN 
的 搜索 空间 比 SAA 的 大 。CHNN 所 定义 的 目标 函数 既 包 含 了 对 总 距离 的 限制 ， 又 包含 着 
对 解 的 形式 的 限制 ， 这 酚 者 之 间 必 然 要 有 权衡 。 只 有 在 时 间 无 限 长 的 情况 下 ，CHNN 定 
祥 的 目标 函数 才能 取 到 最 小 值 ， 此 时 CHNN 才能 得 到 焉 离 最 小 的 可 行 解 。 事 实 上 ， 我 们 
只 能 得 到 次 优 解 ， 故 在 所 得 解 中 有 可 能 存在 非 可 行 解 ， 也 就 是 说 ，CHNN 要 从 解 中 钴 选 
出 问题 的 可 行 解 。 从 这 个 意义 上 说 ，SAA 比 CHNN 的 效率 更 高 。 

人 CHNN 是 一 种 并 行 的 算法 。 在 不 考虑 解 的 质量 ， 只 考虑 得 到 一 个 解 的 速度 时 ， 当 
城市 数目 小 于 10 时 ，CHNN 总 的 来 说 比 SAA 快 ， 这 是 很 客 易 理 解 的 。 其 实 ， 这 两 种 算 
法 正 反 映 了 TSP 这 类 问题 的 特点 一 一 不 存在 多 项 式 时 间 内 的 求解 算法 。CHNN 以 牺牲 空 
间 为 代价 ， 换 取 求 解 时 间 的 减少 ; SAA 占用 的 存储 空间 较 小 ， 但 是 在 求解 时 间 上 有 所 牺 
性。 在 时 间 积 空间 之 间 做 出 权衡 ， 是 求解 TSP 这 类 问题 时 必须 面 对 的 问题 。 

综合 以 上 分 析 ， 可 以 看 出 ，SAA 在 求解 TSP 这 类 问题 时 比 CHNN 更 为 有 效 。 从 实验 
中 ， 我 们 可 以 很 容易 地 看 到 ，SAA 得 到 的 解 的 质量 更 高 ， 时 间 也 不 一 定 比 CHNN 所 需要 
的 时 间 长 ， 这 是 国 为 CHNN 要 对 解 进行 姓 选 ， 并 且 CHMNN 构造 权 矩 阵 的 时 间 也 随 城 市 数 
目的 增 大 而 增 大 。 用 CHNN 求解 TSP 问题 时 ， 当 城市 数目 大 于 30 时 ， 基 本 上 很 难得 到 
一 个 解 《 时 间 过 长 、 存 情 客 量 过 大 )。 但 使 用 SAA 可 以 很 轻松 地 求 得 30 个 城市 的 TSP 问 
题 。 图 16.5 就 是 35 个 城市 的 例子 。 

用 MATLAB 编制 的 CHNN 的 程序 求解 有 名 的 144 个 城市 的 TSP〔〈 即 CHN144 实例 》 
几乎 是 不 可 能 的 ， 但 是 用 SAA 则 可 以 求 出 解 ， 不 过 要 花费 数 小 时 的 时 间 。 图 16.6 给 出 了 
利用 本 章 所 述 方 法 ， 采 用 如 图 16.1 所 编制 的 程序 与 界面 ， 求 出 144 个 城市 的 TSP 的 一 种 
解 的 疼 形 。 图 16.6 中 显示 的 结果 是 算法 终止 时 的 解 ， 在 求解 过 程 中 ， 得 到 的 最 小 值 是 ; 
31167.7。 由 于 以 上 所 有 的 数据 是 用 MATLAB 编制 的 程序 来 执行 的 ， 而 MATLAB 虽然 是 
便于 使 用 的 语言 ， 但 不 是 一 种 高 效 语 言 ， 因 此 ， 若 换 用 其 他 语言 会 大 大 提高 求解 的 速度 。 
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Tha minimum distance is 532078. 
21835 wansiorms have been acceplied. 


图 16.5 SAA 求解 35 个 城市 的 TSP 续 米 


The minimunm dstancsk311677 | 
989210yansforms have 
1 been acceplod 了 2 


图 16.6 SAA 孙 解 CHNI4 实例 


16.4 模拟 退火 昔 法 的 改进 


本 章 讨论 的 盐 经典 的 模拟 退 天 算法 ， 它 还 有 可 以 改进 的 地 方 ， 尤其 是 如 何 确定 冷却 进 
度 表 的 参数 方面 ， 日 前 主要 有 以 下 几 个 改进 方法 。 

1) 加 温 退 火 法 

对 任意 给 定 的 初始 解 pb， 先 令 和 = 0， 然 后 进行 若干 次 试验 ， 当 且 仅 当 目 标 函 数值 增 
大 时 接 爱 其 转移 ， 同 时 令 如 护 某 个 增 熏 沙 数 站 D 增 加 ， 当 试验 结束 时 ， 以 所 获得 的 扩 值 作 


为 控制 参数 x 的 初始 值 ， 并 以 此 时 的 解 j 作为 初始 解 开始 退火 。 所 需要 解决 的 问题 是 :如 


增 大 到 何 时 为 目 ? 

2 有 记忆 的 SAA 

将 退火 过 程 中 产生 的 解 都 记录 下 米 ， 再 与 最 终 解 比较 ， 取 其 最 小 者 。 

3 快速 模拟 退火 工法 (FSA } 

FSA 赵 针对 产生 概率 服从 正 态 分 布 的 SAA 提出 的 ， 它 用 D 维 的 Cauchy 分 布 函数 来 
产生 新 解 ，Cauchy 分 布 与 正太 分布 类 似 ， 采 用 这 种 分 布 函数 来 产生 新 解 的 好 处 是 ， 离 肯 
解 越 近 的 地 方 的 解 产 生 的 概率 越 大 ， 这 就 使 得 算法 在 概率 上 更 倾向 于 局 部 搜索 ， 同 时， 采 
用 Cauchy 分 布 ， 离 旧 解 较 远 的 解 的 产生 概率 比 采 用 正 态 分 布 时 的 产生 概率 大 ， 因 此 ，FSA 
能 够 产生 较 大 的 “跳跃 "。 从 而 ，FSA 能 缩短 求解 的 时 间 。 本 章 采 用 的 产生 概率 是 邻 域内 
的 均匀 分 布 ， 它 使 得 算法 在 概率 上 是 一 种 邻 域 内 的 全 局 搜索 法 ， 并 县 实现 方便 。 

另外 ， 这 有 一 些 带 返 回 搜索 的 SA、 多 次 寻 优 、 回 火 退 火 法 ， 日 前 比较 新 的 关于 SAA 
的 变异 方法 有 : 和 适应 模拟 退火 《ASA)、Cooperative Simulated Annealjing (COSA) 等 。 
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